AI: дайджест за 22 марта 2026
Заявления Маска о «космических датацентрах» и планах SpaceX по производству чипов
Сообщается о планах, связанных с орбитальными энергетическими спутниками (рендер 100 кВт, масса около тонны) и идеей выводить их на орбиту десятками запуском Starship. Также утверждается, что SpaceX якобы планируют построить собственное производство чипов с крайне амбициозной вертикальной интеграцией и масштабом «тераватт чипов в год», что при реализации могло бы радикально повлиять на доступность вычислений для AI.Источники: t.me/ai_newz
Китай включил развитие AGI в формулировки следующей пятилетки
В планах следующей пятилетки КПК упомянуто поощрение инноваций в мультимодальных технологиях, интеллектуальных агентах, воплощённом и коллективном интеллекте, а также исследование путей развития общего искусственного интеллекта (AGI). Это сигнализирует о политическом закреплении AGI как приоритетного направления на уровне госстратегии.Источники: t.me/denissexy
V-JEPA 2.1 от FAIR: единые self-supervised признаки для изображений и видео
FAIR представили V-JEPA 2.1 — self-supervised vision-модели, которые объединяют репрезентации картинок и видео за счёт модифицированной JEPA-цели: супервизия идёт и по видимым токенам (лосс с весами по расстоянию) и применяется иерархически к промежуточным слоям. Заявлено, что это снимает компромисс между «плотными» статическими задачами и видео-динамикой, давая сильные результаты и приближая практическое использование единого энкодера как основы для world models и embodied AI.Источники: t.me/gonzo_ML
M²RNN: нелинейные RNN с матричным скрытым состоянием для масштабируемого языкового моделирования
Предложена архитектура Matrix-to-Matrix RNN (M²RNN), где скрытое состояние — матрица, обновляемая через outer product и нелинейность, что повышает выразительность по сравнению с линейными SSM и вниманием. Авторы утверждают, что добавление хотя бы одного слоя M²RNN в гибридные модели может заметно снижать перплексию и улучшать качество на даунстрим-задачах почти без потери пропускной способности, а слабость LSTM/GRU в LM связывают с недостаточной ёмкостью состояния.Источники: t.me/gonzo_ML