AI: дайджест за 30 мая 2026 - 6 июня 2026

AI: дайджест за 30 мая 2026 - 6 июня 2026

1. q0: фреймворк для сверхмногоэпохового предобучения при дефиците данных

Предложен q0 — подход к предобучению, который вместо «полировки» одной модели после насыщения использует параллельные циклические расписания, пул разнообразных моделей и последовательную дистилляцию. Авторы заявляют рост эффективности использования данных до 12,9× и улучшения на бенчмарках до 16×, что важно на фоне исчерпания качественных текстовых данных.

Источники: t.me/gonzo_ML

2. Microsoft раскрыла детали обучения MAI-Thinking-1 (MoE) и пообещала API для файнтюна

Microsoft выпустила подробный техрепорт о тренировке фронтирной LLM с reasoning: MAI-Thinking-1 — MoE с 35B активных и 1T суммарных параметров и контекстом 256k токенов. Модель обучали на кластере из 8000 GB200; в опенсорс её не выкладывают, но планируют дать API для файнтюнинга.

Источники: t.me/ai_newz

3. Google выпустила Magenta RealTime 2: офлайн-генерация музыки на Apple Silicon Mac

Google представила Magenta RealTime 2 — низколатентную музыкальную модель/набор инструментов, работающий локально на Mac с Apple Silicon без интернета. Это расширяет сценарии живого музицирования (клонирование звуков, смешивание жанров, аккомпанемент) без облачной зависимости.

Источники: t.me/cgevent

4. Исследование Стэнфорда: преподаватели права чаще предпочитают ответы ИИ ответам коллег

В исследовании со слепой оценкой почти 3000 сравнений 16 преподавателей права из США чаще выбирали ответы, сгенерированные ИИ, чем ответы, написанные другими преподавателями. ИИ выиграл 75% сравнений, что усиливает аргументы в пользу LLM как учебных ассистентов в юридическом образовании.

Источники: t.me/cgevent

5. LeJEPA: доказана линейная идентифицируемость латентов и связь с планированием

В работе LeCun/Balestriero и соавторов дано математическое доказательство, что LeJEPA может восстанавливать истинные латентные переменные мира из нелинейных наблюдений с точностью до ортогонального поворота при определённых условиях. Авторы утверждают, что этого достаточно для оптимального планирования в латентном пространстве и подчёркивают роль гауссовской регуляризации и BatchNorm для стабильности.

Источники: t.me/gonzo_ML

6. Sber запустил GigaNetwork: платформа для сделок между компаниями через ИИ-агентов

Сбер объявил о запуске GigaNetwork — платформы, где ИИ-агенты компаний ищут контрагентов, проводят тендеры и сопровождают сделки при контроле человеком; ключевые действия фиксируются, заявлена защита через банковскую идентификацию и блокчейн. На ПМЭФ прошли пилоты с партнёрами (в т.ч. автоматизация покупки билетов, закупки комплектующих и организация командировок).

Источники: t.me/official_gigachat

7. На ПМЭФ представили «первый в России» оптический вычислитель для умножения матриц светом

Сообщается о показе оптического вычислителя, который выполняет матричное умножение с помощью света, обещая более высокую скорость и меньшее тепловыделение по сравнению с электроникой. Если заявленные свойства подтвердятся, это может повлиять на энергозатраты и архитектуру будущей ИИ-инфраструктуры.

Источники: t.me/official_gigachat

8. Сбер и X5 договорились о роботизации ритейла: робот Worker на базе Green-VLA

Сбер подписал соглашение с X5 о роботизации ритейла и сообщил о тестовой работе робота Worker в супермаркете-лаборатории. Утверждается, что модель Green-VLA на базе ГигаЧата распознаёт предметы, переводит голосовые команды в действия и адаптируется к изменениям среды, позволяя роботу автономно перемещаться и собирать заказы без перестройки магазина.

Источники: t.me/official_gigachat

9. Reve 2.0: генерация изображений в 4K и рост в лидерборде Arena

Вышла модель Reve 2.0 с нативным 4K и более точным редактированием объектов за счёт сегментации/«precise layouts» (семантических карт). Также заявлено, что модель быстро поднялась до 2-го места в Arena с Elo 1280+.

Источники: t.me/cgevent, t.me/strangedalle

10. Ideogram 4: day-0 поддержка в ComfyUI и инструменты для промптинга/обхода ограничений

Появилась day-0 интеграция Ideogram 4 в ComfyUI, а также ноды/воркфлоу для конвертации промптов и работы с layout-боксами, чтобы снизить проблемы модели при промптинге на обычном языке. Отдельно обсуждается, что цензура у Ideogram 4 «вшита в веса», а NSFW-качество упирается в отсутствие соответствующих данных и необходимость LoRA/файнтюнов.

Источники: t.me/cgevent

Read more

AI: дайджест за 4 июля 2026

AI: дайджест за 4 июля 2026

1. DeepSeek представила DSpark для ускорения спекулятивного декодирования Команда DeepSeek-AI описала фреймворк DSpark: полуавторегрессионный параллельный «драфтер» и шедулер префиксов на основе уверенности, чтобы ускорять инференс LLM под высокой конкурентной нагрузкой. Заявлено ускорение генерации на 60–85% для DeepSeek-V4 при сохранении пропускной способности и без деградации качества в «хвосте» последовательности; код

By Kirill Brusenskiy
AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в

By Kirill Brusenskiy
AI: дайджест за 3 июля 2026

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы

By Kirill Brusenskiy
AI: дайджест за 2 июля 2026

AI: дайджест за 2 июля 2026

1. Сбер открыл в open source диффузионную языковую модель GFusion и интегрировал её в SGLang Сбер выложил экспериментальную диффузионную LLM GFusion (на базе GigaChat) и сопутствующие инструменты обучения, заявив ускорение генерации текста до 45% относительно GigaChat 3. Важно тем, что это публичный опенсорс-эксперимент с альтернативной (не автогрессивной) схемой генерации и

By Kirill Brusenskiy