AI: дайджест за 9 июня 2026
1. В ГигаЧате появилось детальное редактирование фото по выделенной области
В ГигаЧате добавили режим, где пользователь кистью выделяет область на фото и задаёт промпт: изменяется только выделенное, остальное сохраняется. Это упрощает точечные правки (удаление/добавление объектов) без сложных текстовых описаний масок.
Источники: t.me/official_gigachat
2. ГигаЧат научился редактировать изображения с несколькими референсами (до 3 фото)
ИИ в ГигаЧате теперь может переносить одежду/объекты и комбинировать людей и фон, используя до трёх референсных изображений; функция заявлена как часть Kandinsky 6 Image Pro. Это расширяет сценарии композитинга и «примерки» без ручного монтажа.
Источники: t.me/official_gigachat
3. Apple WWDC 2026: противоречивые сообщения о Siri AI на базе Gemini, подписке и доступности
В источниках утверждается, что Siri AI на WWDC 2026 построена на Gemini и глубже интегрируется в ОС (вплоть до отдельного приложения/интеграции в Spotlight), но расходятся детали про доступность: упоминаются США-only, отсутствие русского, привязка к iCloud+ и даже что функция «пока недоступна». Важно, потому что это может означать зависимость ключевых AI-функций Apple от внешней модели и ограниченный запуск.
Источники: t.me/How2AI, t.me/denissexy
4. Исследование: сигналы обучения (градиенты) в зрительных нейросетях не совпадают с иерархией ответов мозга
Авторы сопоставили прямую обработку и градиенты современных vision-моделей с данными фМРТ и МЭГ и пришли к выводу о несоответствии «обучающих» сигналов backprop и наблюдаемой иерархии мозговых ответов. Это поддерживает идею, что мозг учится не через биологический аналог backprop, и может подсказать альтернативные механизмы обучения для ИИ.
Источники: t.me/gonzo_ML
5. MiniMax M3: заявлена модель с контекстом 1 млн токенов и обещанием скорого релиза весов
В дайджесте упоминается выход MiniMax M3 с контекстом до миллиона токенов, доступность со скидкой в API и бесплатно в OpenCode, а также обещание опубликовать веса «на днях». Если подтвердится, это заметно расширит сценарии работы с очень длинными документами и кодовыми базами.
Источники: t.me/ai_newz
6. Google Gemma 4 12B: открытая мультимодальная модель без энкодеров
Сообщается, что Google выпустила Gemma 4 12B под Apache 2.0: гибридный «ризонер» с 256k контекста, который принимает видео/аудио/картинки через линейные проекции. Важно как шаг к более простой мультимодальности в открытых моделях.
Источники: t.me/ai_newz
7. Microsoft опубликовала техрепорт по MAI-Thinking-1 и обещает API для файнтюна
Упоминается, что Microsoft выпустила подробный технический отчёт о тренировке MAI-Thinking-1, при этом модель не планируют открывать, но обещают API для fine-tuning. Это важно из-за редкости детальных отчётов по обучению крупных моделей и потенциальной доступности кастомизации через API.
Источники: t.me/ai_newz
8. PrismML: экстремальная квантизация FLUX.2 Klein 4B до 1 бита (930 МБ)
Стартап PrismML, по сообщению дайджеста, ужал диффузионный трансформер FLUX.2 Klein 4B до 1-битной версии размером около 930 МБ, которая может генерировать изображения прямо в браузере или на iPhone. Это важно как демонстрация радикального снижения требований к железу для генеративной графики.
Источники: t.me/ai_newz
9. PewDiePie выпустил Odysseus — опенсорсный лаунчер для селф-хостинга ИИ
В дайджесте заявлено, что PewDiePie выпустил Odysseus для локального запуска нейросетей с UX «как у ChatGPT», агентным режимом, Deep Research и встроенным Cookbook. Это важно для тренда на удобный self-hosted AI и снижение зависимости от облачных сервисов.
Источники: t.me/ai_newz
10. Сообщение о крупной сделке: Google якобы арендует у SpaceX 110 тыс. Blackwell за $920 млн в месяц
В дайджесте утверждается, что Google станет «мега-клиентом» датацентров SpaceX, арендуя 110 тысяч GPU Blackwell за $920 млн в месяц, что якобы даёт около $26 млрд в год выручки. Если данные верны, это заметный сигнал о масштабировании спроса на вычисления и новых игроках в инфраструктуре.
Источники: t.me/ai_newz