AI: дайджест за 16 апреля 2026
Вышла Nucleus-Image — «sparse MoE diffusion transformer» text-to-image с весами и техрепортом
Nucleus AI выпустила Nucleus-Image — text-to-image модель на базе sparse Mixture-of-Experts diffusion transformer (17B параметров, активируется ~2B, 64 эксперта), заявлена как base model без пост-тюнинга (без DPO/RL/human preference); опубликованы веса, техрепорт и материалы, но код на момент сообщения еще не залит. Это важно как попытка сделать более эффективную по вычислениям T2I-модель с «day 0» поддержкой в Hugging Face diffusers и с крупным датасетом обучения (в посте: ~1.5B пар, ~700M уникальных изображений).Источники: t.me/cgevent
Анонсирован офлайн-митап о внедрении ИИ в enterprise Java (Spring AI, RAG, ассистенты)
23 апреля в Москве пройдет офлайн-митап команды Джеймикс о практическом внедрении ИИ в корпоративные Java-системы: обещают разбор продакшен-кейсов со Spring AI, RAG и ИИ-ассистентами, включая архитектурные компромиссы и неудачные подходы. Это важно для инженеров, которым нужен прикладной опыт интеграции LLM в легаси и комплаенс-ограниченные системы.Источники: t.me/cgevent
ГигаЧат: в голосовом режиме появился автопоиск в интернете и расшифровка диалога
В ГигаЧате во время живого голосового диалога автоматически подключается интернет для подгрузки актуальных данных; также заявлены «рефразер» для переформулирования голосовых запросов и сохранение полной текстовой расшифровки разговора. Это важно как продуктовый апдейт, повышающий полезность голосового ассистента для задач, требующих свежей информации и последующего пересмотра ответа.Источники: t.me/official_gigachat
Google представила Gemini 3.1 Flash TTS с Audio Tags
Google выпустила модель Gemini 3.1 Flash TTS для генерации речи, где ключевая фича — Audio Tags: теги прямо в промпте для управления стилем, эмоциями и темпом, с возможностью редактирования «на лету»; заявлена поддержка 70+ языков, включая русский, и доступ через AI Studio и Vertex AI. Это важно для более управляемого TTS в продуктах и контент-пайплайнах.Источники: t.me/cgevent
Microsoft предложила Universal Verifier для оценки Computer Use Agents и выпустила CUAVerifierBench
В работе про верификацию Computer Use Agents описан Universal Verifier — многоэтапная система оценки траекторий с рубрикаторами под задачи, мультимодальной проверкой по скриншотам и разделением process/outcome rewards; также открыт датасет CUAVerifierBench из 246 размеченных траекторий и код. Это важно, потому что надежная верификация снижает ложноположительные оценки (в посте заявлено падение с >30% до ~1%) и помогает масштабировать RLHF/самообучение агентных систем.Источники: t.me/gonzo_ML
NVIDIA выпустила опенсорсный генератор «миров» Lyra 2.0 для пролетов по сценам
NVIDIA представила Lyra 2.0 — опенсорсный генератор видео-пролетов по сценам, создаваемым по одной или нескольким картинкам, с возможностью дальнейшего преобразования результата в 3D-модели/сетки и экспорта в физические движки (упомянут Isaac Sim). Это важно для симуляции и обучения робототехники, где нужны масштабируемые синтетические среды, а не только «художественные» видео.Источники: t.me/cgevent
Tencent начала выкладывать код HY-World 2.0 (пока WorldMirror 2.0)
Tencent-Hunyuan начала публиковать код HY-World 2.0 — мультимодальной «модели мира» для генерации и реконструкции 3D-сцен из текста/изображений/видео (сетки/гауссианы); на текущем этапе выложены код и веса компонента WorldMirror 2.0. Это важно как шаг к практическому опенсорсу инструментов для построения навигационных 3D-миров и реконструкции сцен.Источники: t.me/cgevent
Появился сервис Happy Oyster/Happy Horse для генерации «миров»; команда предупреждает о фейковых сайтах
Запустился новый генератор миров от команды Happy Horse/Happy Oyster: заявлен мультимодальный ввод, режимы Directing/Wandering, выход 720p и время генерации 1–3 минуты; позже команда сообщила, что «официальных вебсайтов» не существует и текущие сайты могут быть фейками, а также пообещала официальный запуск через две недели и участие в слепом тесте на leaderboard. Важно из-за быстрого появления нового видеогенератора и риска дезинформации вокруг доступа к продукту.Источники: t.me/cgevent
DaVinci Resolve добавила Photo Page для работы с фотографиями (с AI-функциями)
Blackmagic представила Photo Page в DaVinci Resolve — отдельный раздел для фотографов с RAW-поддержкой (в т.ч. iPhone ProRAW), пакетной GPU-обработкой, инструментами цветокоррекции Resolve и AI IntelliSearch; также упомянуты AI-инструменты для фокуса и работы с лицами в Resolve 21 и импорт из Lightroom. Это расширяет Resolve за пределы видеопайплайна и добавляет ИИ-инструменты в фотообработку.Источники: t.me/cgevent
Опубликованы веса Qwen 3.6 35B-A3B
Выложены веса Qwen 3.6 35B-A3B; сообщается, что модель часто обгоняет Qwen 3.5 27B dense по бенчмаркам, а конкурент Gemma 4 немного отстает, но достигает результатов с меньшим расходом токенов. Новость важна как очередной заметный релиз в линейке Qwen на фоне упомянутых внутренних перестановок и фокуса на прибыль.Источники: t.me/ai_newz
Anthropic выпустила Claude Opus 4.7
Вышло обновление Claude Opus 4.7: улучшена работа с длительными задачами и следование инструкциям, добавлен новый уровень reasoning effort xhigh, расширены возможности Claude Code (в т.ч. /ultrareview и auto mode для Max), а также увеличено поддерживаемое разрешение изображений во Vision примерно в 3 раза; заявлена неизменная цена. Это важно для пользователей, которым нужны более надежные агентные сценарии, лучшее код-ревью и более точная работа с визуальными входами.Источники: t.me/strangedalle, t.me/ai_newz, t.me/cgevent, t.me/How2AI