AI: дайджест за 22 марта 2026

Kirill Brusenskiy

22 Mar 2026 — 1 min read

1. M²RNN: нелинейные RNN с матричным скрытым состоянием для масштабируемого языкового моделирования

Предложена архитектура Matrix-to-Matrix RNN (M²RNN), где скрытое состояние — матрица, обновляемая через outer product и нелинейность, что повышает выразительность по сравнению с линейными SSM и вниманием. Авторы утверждают, что добавление хотя бы одного слоя M²RNN в гибридные модели может заметно снижать перплексию и улучшать качество на даунстрим-задачах почти без потери пропускной способности, а слабость LSTM/GRU в LM связывают с недостаточной ёмкостью состояния.

Источники: t.me/gonzo_ML

2. V-JEPA 2.1 от FAIR: единые self-supervised признаки для изображений и видео

FAIR представили V-JEPA 2.1 — self-supervised vision-модели, которые объединяют репрезентации картинок и видео за счёт модифицированной JEPA-цели: супервизия идёт и по видимым токенам (лосс с весами по расстоянию) и применяется иерархически к промежуточным слоям. Заявлено, что это снимает компромисс между «плотными» статическими задачами и видео-динамикой, давая сильные результаты и приближая практическое использование единого энкодера как основы для world models и embodied AI.

Источники: t.me/gonzo_ML

3. Китай включил развитие AGI в формулировки следующей пятилетки

В планах следующей пятилетки КПК упомянуто поощрение инноваций в мультимодальных технологиях, интеллектуальных агентах, воплощённом и коллективном интеллекте, а также исследование путей развития общего искусственного интеллекта (AGI). Это сигнализирует о политическом закреплении AGI как приоритетного направления на уровне госстратегии.

Источники: t.me/denissexy

4. Заявления Маска о «космических датацентрах» и планах SpaceX по производству чипов

Сообщается о планах, связанных с орбитальными энергетическими спутниками (рендер 100 кВт, масса около тонны) и идеей выводить их на орбиту десятками запуском Starship. Также утверждается, что SpaceX якобы планируют построить собственное производство чипов с крайне амбициозной вертикальной интеграцией и масштабом «тераватт чипов в год», что при реализации могло бы радикально повлиять на доступность вычислений для AI.

Источники: t.me/ai_newz

AI: дайджест за 5 июля 2026

1. HOLA: «гиппокамп» для линейного внимания с точной эпизодической памятью В работе «A Hippocampus for Linear Attention» предложена архитектура Hippocampal Linear Attention (HOLA): к рекуррентной state-space основе добавляется небольшой точный KV-кэш, который сохраняет наиболее «удивительные» токены по метрике из остатка дельта-правила. Это снижает перплексию на Wikitext-103 на 16,1% и

AI: дайджест за 4 июля 2026

1. DeepSeek представила DSpark для ускорения спекулятивного декодирования Команда DeepSeek-AI описала фреймворк DSpark: полуавторегрессионный параллельный «драфтер» и шедулер префиксов на основе уверенности, чтобы ускорять инференс LLM под высокой конкурентной нагрузкой. Заявлено ускорение генерации на 60–85% для DeepSeek-V4 при сохранении пропускной способности и без деградации качества в «хвосте» последовательности; код

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы