AI: дайджест за 16 апреля 2026

Kirill Brusenskiy

16 Apr 2026 — 3 min read

1. Anthropic выпустила Claude Opus 4.7

Вышло обновление Claude Opus 4.7: улучшена работа с длительными задачами и следование инструкциям, добавлен новый уровень reasoning effort xhigh, расширены возможности Claude Code (в т.ч. /ultrareview и auto mode для Max), а также увеличено поддерживаемое разрешение изображений во Vision примерно в 3 раза; заявлена неизменная цена. Это важно для пользователей, которым нужны более надежные агентные сценарии, лучшее код-ревью и более точная работа с визуальными входами.

Источники: t.me/strangedalle, t.me/ai_newz, t.me/cgevent, t.me/How2AI

2. Опубликованы веса Qwen 3.6 35B-A3B

Выложены веса Qwen 3.6 35B-A3B; сообщается, что модель часто обгоняет Qwen 3.5 27B dense по бенчмаркам, а конкурент Gemma 4 немного отстает, но достигает результатов с меньшим расходом токенов. Новость важна как очередной заметный релиз в линейке Qwen на фоне упомянутых внутренних перестановок и фокуса на прибыль.

Источники: t.me/ai_newz

3. DaVinci Resolve добавила Photo Page для работы с фотографиями (с AI-функциями)

Blackmagic представила Photo Page в DaVinci Resolve — отдельный раздел для фотографов с RAW-поддержкой (в т.ч. iPhone ProRAW), пакетной GPU-обработкой, инструментами цветокоррекции Resolve и AI IntelliSearch; также упомянуты AI-инструменты для фокуса и работы с лицами в Resolve 21 и импорт из Lightroom. Это расширяет Resolve за пределы видеопайплайна и добавляет ИИ-инструменты в фотообработку.

Источники: t.me/cgevent

4. Появился сервис Happy Oyster/Happy Horse для генерации «миров»; команда предупреждает о фейковых сайтах

Запустился новый генератор миров от команды Happy Horse/Happy Oyster: заявлен мультимодальный ввод, режимы Directing/Wandering, выход 720p и время генерации 1–3 минуты; позже команда сообщила, что «официальных вебсайтов» не существует и текущие сайты могут быть фейками, а также пообещала официальный запуск через две недели и участие в слепом тесте на leaderboard. Важно из-за быстрого появления нового видеогенератора и риска дезинформации вокруг доступа к продукту.

Источники: t.me/cgevent

5. Tencent начала выкладывать код HY-World 2.0 (пока WorldMirror 2.0)

Tencent-Hunyuan начала публиковать код HY-World 2.0 — мультимодальной «модели мира» для генерации и реконструкции 3D-сцен из текста/изображений/видео (сетки/гауссианы); на текущем этапе выложены код и веса компонента WorldMirror 2.0. Это важно как шаг к практическому опенсорсу инструментов для построения навигационных 3D-миров и реконструкции сцен.

Источники: t.me/cgevent

6. NVIDIA выпустила опенсорсный генератор «миров» Lyra 2.0 для пролетов по сценам

NVIDIA представила Lyra 2.0 — опенсорсный генератор видео-пролетов по сценам, создаваемым по одной или нескольким картинкам, с возможностью дальнейшего преобразования результата в 3D-модели/сетки и экспорта в физические движки (упомянут Isaac Sim). Это важно для симуляции и обучения робототехники, где нужны масштабируемые синтетические среды, а не только «художественные» видео.

Источники: t.me/cgevent

7. Microsoft предложила Universal Verifier для оценки Computer Use Agents и выпустила CUAVerifierBench

В работе про верификацию Computer Use Agents описан Universal Verifier — многоэтапная система оценки траекторий с рубрикаторами под задачи, мультимодальной проверкой по скриншотам и разделением process/outcome rewards; также открыт датасет CUAVerifierBench из 246 размеченных траекторий и код. Это важно, потому что надежная верификация снижает ложноположительные оценки (в посте заявлено падение с >30% до ~1%) и помогает масштабировать RLHF/самообучение агентных систем.

Источники: t.me/gonzo_ML

8. Google представила Gemini 3.1 Flash TTS с Audio Tags

Google выпустила модель Gemini 3.1 Flash TTS для генерации речи, где ключевая фича — Audio Tags: теги прямо в промпте для управления стилем, эмоциями и темпом, с возможностью редактирования «на лету»; заявлена поддержка 70+ языков, включая русский, и доступ через AI Studio и Vertex AI. Это важно для более управляемого TTS в продуктах и контент-пайплайнах.

Источники: t.me/cgevent

9. ГигаЧат: в голосовом режиме появился автопоиск в интернете и расшифровка диалога

В ГигаЧате во время живого голосового диалога автоматически подключается интернет для подгрузки актуальных данных; также заявлены «рефразер» для переформулирования голосовых запросов и сохранение полной текстовой расшифровки разговора. Это важно как продуктовый апдейт, повышающий полезность голосового ассистента для задач, требующих свежей информации и последующего пересмотра ответа.

Источники: t.me/official_gigachat

10. Анонсирован офлайн-митап о внедрении ИИ в enterprise Java (Spring AI, RAG, ассистенты)

23 апреля в Москве пройдет офлайн-митап команды Джеймикс о практическом внедрении ИИ в корпоративные Java-системы: обещают разбор продакшен-кейсов со Spring AI, RAG и ИИ-ассистентами, включая архитектурные компромиссы и неудачные подходы. Это важно для инженеров, которым нужен прикладной опыт интеграции LLM в легаси и комплаенс-ограниченные системы.

Источники: t.me/cgevent

11. Вышла Nucleus-Image — «sparse MoE diffusion transformer» text-to-image с весами и техрепортом

Nucleus AI выпустила Nucleus-Image — text-to-image модель на базе sparse Mixture-of-Experts diffusion transformer (17B параметров, активируется ~2B, 64 эксперта), заявлена как base model без пост-тюнинга (без DPO/RL/human preference); опубликованы веса, техрепорт и материалы, но код на момент сообщения еще не залит. Это важно как попытка сделать более эффективную по вычислениям T2I-модель с «day 0» поддержкой в Hugging Face diffusers и с крупным датасетом обучения (в посте: ~1.5B пар, ~700M уникальных изображений).

Источники: t.me/cgevent

AI: дайджест за 16 апреля 2026

Kirill Brusenskiy

1. Anthropic выпустила Claude Opus 4.7

2. Опубликованы веса Qwen 3.6 35B-A3B

3. DaVinci Resolve добавила Photo Page для работы с фотографиями (с AI-функциями)

4. Появился сервис Happy Oyster/Happy Horse для генерации «миров»; команда предупреждает о фейковых сайтах

5. Tencent начала выкладывать код HY-World 2.0 (пока WorldMirror 2.0)

6. NVIDIA выпустила опенсорсный генератор «миров» Lyra 2.0 для пролетов по сценам

7. Microsoft предложила Universal Verifier для оценки Computer Use Agents и выпустила CUAVerifierBench

8. Google представила Gemini 3.1 Flash TTS с Audio Tags

9. ГигаЧат: в голосовом режиме появился автопоиск в интернете и расшифровка диалога

10. Анонсирован офлайн-митап о внедрении ИИ в enterprise Java (Spring AI, RAG, ассистенты)

11. Вышла Nucleus-Image — «sparse MoE diffusion transformer» text-to-image с весами и техрепортом

Read more

AI: дайджест за 5 июля 2026

AI: дайджест за 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 3 июля 2026