AI: дайджест за 9 июня 2026

AI: дайджест за 9 июня 2026

1. В ГигаЧате появилось детальное редактирование фото по выделенной области

В ГигаЧате добавили режим, где пользователь кистью выделяет область на фото и задаёт промпт: изменяется только выделенное, остальное сохраняется. Это упрощает точечные правки (удаление/добавление объектов) без сложных текстовых описаний масок.

Источники: t.me/official_gigachat

2. ГигаЧат научился редактировать изображения с несколькими референсами (до 3 фото)

ИИ в ГигаЧате теперь может переносить одежду/объекты и комбинировать людей и фон, используя до трёх референсных изображений; функция заявлена как часть Kandinsky 6 Image Pro. Это расширяет сценарии композитинга и «примерки» без ручного монтажа.

Источники: t.me/official_gigachat

3. Apple WWDC 2026: противоречивые сообщения о Siri AI на базе Gemini, подписке и доступности

В источниках утверждается, что Siri AI на WWDC 2026 построена на Gemini и глубже интегрируется в ОС (вплоть до отдельного приложения/интеграции в Spotlight), но расходятся детали про доступность: упоминаются США-only, отсутствие русского, привязка к iCloud+ и даже что функция «пока недоступна». Важно, потому что это может означать зависимость ключевых AI-функций Apple от внешней модели и ограниченный запуск.

Источники: t.me/How2AI, t.me/denissexy

4. Исследование: сигналы обучения (градиенты) в зрительных нейросетях не совпадают с иерархией ответов мозга

Авторы сопоставили прямую обработку и градиенты современных vision-моделей с данными фМРТ и МЭГ и пришли к выводу о несоответствии «обучающих» сигналов backprop и наблюдаемой иерархии мозговых ответов. Это поддерживает идею, что мозг учится не через биологический аналог backprop, и может подсказать альтернативные механизмы обучения для ИИ.

Источники: t.me/gonzo_ML

5. MiniMax M3: заявлена модель с контекстом 1 млн токенов и обещанием скорого релиза весов

В дайджесте упоминается выход MiniMax M3 с контекстом до миллиона токенов, доступность со скидкой в API и бесплатно в OpenCode, а также обещание опубликовать веса «на днях». Если подтвердится, это заметно расширит сценарии работы с очень длинными документами и кодовыми базами.

Источники: t.me/ai_newz

6. Google Gemma 4 12B: открытая мультимодальная модель без энкодеров

Сообщается, что Google выпустила Gemma 4 12B под Apache 2.0: гибридный «ризонер» с 256k контекста, который принимает видео/аудио/картинки через линейные проекции. Важно как шаг к более простой мультимодальности в открытых моделях.

Источники: t.me/ai_newz

7. Microsoft опубликовала техрепорт по MAI-Thinking-1 и обещает API для файнтюна

Упоминается, что Microsoft выпустила подробный технический отчёт о тренировке MAI-Thinking-1, при этом модель не планируют открывать, но обещают API для fine-tuning. Это важно из-за редкости детальных отчётов по обучению крупных моделей и потенциальной доступности кастомизации через API.

Источники: t.me/ai_newz

8. PrismML: экстремальная квантизация FLUX.2 Klein 4B до 1 бита (930 МБ)

Стартап PrismML, по сообщению дайджеста, ужал диффузионный трансформер FLUX.2 Klein 4B до 1-битной версии размером около 930 МБ, которая может генерировать изображения прямо в браузере или на iPhone. Это важно как демонстрация радикального снижения требований к железу для генеративной графики.

Источники: t.me/ai_newz

9. PewDiePie выпустил Odysseus — опенсорсный лаунчер для селф-хостинга ИИ

В дайджесте заявлено, что PewDiePie выпустил Odysseus для локального запуска нейросетей с UX «как у ChatGPT», агентным режимом, Deep Research и встроенным Cookbook. Это важно для тренда на удобный self-hosted AI и снижение зависимости от облачных сервисов.

Источники: t.me/ai_newz

10. Сообщение о крупной сделке: Google якобы арендует у SpaceX 110 тыс. Blackwell за $920 млн в месяц

В дайджесте утверждается, что Google станет «мега-клиентом» датацентров SpaceX, арендуя 110 тысяч GPU Blackwell за $920 млн в месяц, что якобы даёт около $26 млрд в год выручки. Если данные верны, это заметный сигнал о масштабировании спроса на вычисления и новых игроках в инфраструктуре.

Источники: t.me/ai_newz

Read more

AI: дайджест за 4 июля 2026

AI: дайджест за 4 июля 2026

1. DeepSeek представила DSpark для ускорения спекулятивного декодирования Команда DeepSeek-AI описала фреймворк DSpark: полуавторегрессионный параллельный «драфтер» и шедулер префиксов на основе уверенности, чтобы ускорять инференс LLM под высокой конкурентной нагрузкой. Заявлено ускорение генерации на 60–85% для DeepSeek-V4 при сохранении пропускной способности и без деградации качества в «хвосте» последовательности; код

By Kirill Brusenskiy
AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в

By Kirill Brusenskiy
AI: дайджест за 3 июля 2026

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы

By Kirill Brusenskiy
AI: дайджест за 2 июля 2026

AI: дайджест за 2 июля 2026

1. Сбер открыл в open source диффузионную языковую модель GFusion и интегрировал её в SGLang Сбер выложил экспериментальную диффузионную LLM GFusion (на базе GigaChat) и сопутствующие инструменты обучения, заявив ускорение генерации текста до 45% относительно GigaChat 3. Важно тем, что это публичный опенсорс-эксперимент с альтернативной (не автогрессивной) схемой генерации и

By Kirill Brusenskiy