AI: дайджест за 30 мая 2026 - 6 июня 2026
1. q0: фреймворк для сверхмногоэпохового предобучения при дефиците данных
Предложен q0 — подход к предобучению, который вместо «полировки» одной модели после насыщения использует параллельные циклические расписания, пул разнообразных моделей и последовательную дистилляцию. Авторы заявляют рост эффективности использования данных до 12,9× и улучшения на бенчмарках до 16×, что важно на фоне исчерпания качественных текстовых данных.
Источники: t.me/gonzo_ML
2. Microsoft раскрыла детали обучения MAI-Thinking-1 (MoE) и пообещала API для файнтюна
Microsoft выпустила подробный техрепорт о тренировке фронтирной LLM с reasoning: MAI-Thinking-1 — MoE с 35B активных и 1T суммарных параметров и контекстом 256k токенов. Модель обучали на кластере из 8000 GB200; в опенсорс её не выкладывают, но планируют дать API для файнтюнинга.
Источники: t.me/ai_newz
3. Google выпустила Magenta RealTime 2: офлайн-генерация музыки на Apple Silicon Mac
Google представила Magenta RealTime 2 — низколатентную музыкальную модель/набор инструментов, работающий локально на Mac с Apple Silicon без интернета. Это расширяет сценарии живого музицирования (клонирование звуков, смешивание жанров, аккомпанемент) без облачной зависимости.
Источники: t.me/cgevent
4. Исследование Стэнфорда: преподаватели права чаще предпочитают ответы ИИ ответам коллег
В исследовании со слепой оценкой почти 3000 сравнений 16 преподавателей права из США чаще выбирали ответы, сгенерированные ИИ, чем ответы, написанные другими преподавателями. ИИ выиграл 75% сравнений, что усиливает аргументы в пользу LLM как учебных ассистентов в юридическом образовании.
Источники: t.me/cgevent
5. LeJEPA: доказана линейная идентифицируемость латентов и связь с планированием
В работе LeCun/Balestriero и соавторов дано математическое доказательство, что LeJEPA может восстанавливать истинные латентные переменные мира из нелинейных наблюдений с точностью до ортогонального поворота при определённых условиях. Авторы утверждают, что этого достаточно для оптимального планирования в латентном пространстве и подчёркивают роль гауссовской регуляризации и BatchNorm для стабильности.
Источники: t.me/gonzo_ML
6. Sber запустил GigaNetwork: платформа для сделок между компаниями через ИИ-агентов
Сбер объявил о запуске GigaNetwork — платформы, где ИИ-агенты компаний ищут контрагентов, проводят тендеры и сопровождают сделки при контроле человеком; ключевые действия фиксируются, заявлена защита через банковскую идентификацию и блокчейн. На ПМЭФ прошли пилоты с партнёрами (в т.ч. автоматизация покупки билетов, закупки комплектующих и организация командировок).
Источники: t.me/official_gigachat
7. На ПМЭФ представили «первый в России» оптический вычислитель для умножения матриц светом
Сообщается о показе оптического вычислителя, который выполняет матричное умножение с помощью света, обещая более высокую скорость и меньшее тепловыделение по сравнению с электроникой. Если заявленные свойства подтвердятся, это может повлиять на энергозатраты и архитектуру будущей ИИ-инфраструктуры.
Источники: t.me/official_gigachat
8. Сбер и X5 договорились о роботизации ритейла: робот Worker на базе Green-VLA
Сбер подписал соглашение с X5 о роботизации ритейла и сообщил о тестовой работе робота Worker в супермаркете-лаборатории. Утверждается, что модель Green-VLA на базе ГигаЧата распознаёт предметы, переводит голосовые команды в действия и адаптируется к изменениям среды, позволяя роботу автономно перемещаться и собирать заказы без перестройки магазина.
Источники: t.me/official_gigachat
9. Reve 2.0: генерация изображений в 4K и рост в лидерборде Arena
Вышла модель Reve 2.0 с нативным 4K и более точным редактированием объектов за счёт сегментации/«precise layouts» (семантических карт). Также заявлено, что модель быстро поднялась до 2-го места в Arena с Elo 1280+.
Источники: t.me/cgevent, t.me/strangedalle
10. Ideogram 4: day-0 поддержка в ComfyUI и инструменты для промптинга/обхода ограничений
Появилась day-0 интеграция Ideogram 4 в ComfyUI, а также ноды/воркфлоу для конвертации промптов и работы с layout-боксами, чтобы снизить проблемы модели при промптинге на обычном языке. Отдельно обсуждается, что цензура у Ideogram 4 «вшита в веса», а NSFW-качество упирается в отсутствие соответствующих данных и необходимость LoRA/файнтюнов.
Источники: t.me/cgevent