AI: дайджест за 14 июня 2026

AI: дайджест за 14 июня 2026

1. Новый метод DPG для генерации синтетических датасетов под любую дифференцируемую цель

В работе «Synthetic Data for any Differentiable Target» представлен Dataset Policy Gradient (DPG): RL-подход, который оптимизирует генератор синтетических данных на уровне отдельных примеров, используя многошаговые метаградиенты как сигнал награды. Это важно, потому что метод позволяет целенаправленно менять поведение модели через файнтюнинг (вплоть до скрытых эффектов вроде clean-label data poisoning), снижая необходимость в дорогом переобучении с нуля.

Источники: t.me/gonzo_ML

2. LTX готовит релиз LTX-2: dense и MoE-версии, новый text encoder и открытые инструменты обучения

CEO LTX рассказал, что следующий релиз LTX-2 будет нацелен на рост качества и выйдет в двух вариантах (dense и mixture-of-experts) с более мощным text encoder, оптимизациями производительности/памяти и поддержкой low-precision. Также обещаны более открытые trainer-рецепты и инструменты для обучения LoRA, а в исследованиях — diffusion-based decoder вместо VAE для более чёткого вывода и высокого разрешения; при этом заявлено намерение сохранять веса и инструменты открытыми.

Источники: t.me/cgevent

3. Kandinsky отмечает 4 года: рост аудитории и заявленное лидерство Kandinsky 5 Video Pro среди open-source

Команда GigaChat сообщила, что семейству моделей Kandinsky исполнилось 4 года, а число пользователей за год выросло до 17 млн; также приведены объёмы генераций (246 млн картинок и 18 млн видео). Отдельно заявлено, что Kandinsky 5 Video Pro стал топ-1 в мире среди open-source моделей для генерации видео по итогам прошлого года, что подчёркивает конкурентоспособность линейки в видео-генерации.

Источники: t.me/official_gigachat

Read more

AI: дайджест за 4 июля 2026

AI: дайджест за 4 июля 2026

1. DeepSeek представила DSpark для ускорения спекулятивного декодирования Команда DeepSeek-AI описала фреймворк DSpark: полуавторегрессионный параллельный «драфтер» и шедулер префиксов на основе уверенности, чтобы ускорять инференс LLM под высокой конкурентной нагрузкой. Заявлено ускорение генерации на 60–85% для DeepSeek-V4 при сохранении пропускной способности и без деградации качества в «хвосте» последовательности; код

By Kirill Brusenskiy
AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в

By Kirill Brusenskiy
AI: дайджест за 3 июля 2026

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы

By Kirill Brusenskiy
AI: дайджест за 2 июля 2026

AI: дайджест за 2 июля 2026

1. Сбер открыл в open source диффузионную языковую модель GFusion и интегрировал её в SGLang Сбер выложил экспериментальную диффузионную LLM GFusion (на базе GigaChat) и сопутствующие инструменты обучения, заявив ускорение генерации текста до 45% относительно GigaChat 3. Важно тем, что это публичный опенсорс-эксперимент с альтернативной (не автогрессивной) схемой генерации и

By Kirill Brusenskiy