AI: дайджест за 14 июня 2026
1. Новый метод DPG для генерации синтетических датасетов под любую дифференцируемую цель
В работе «Synthetic Data for any Differentiable Target» представлен Dataset Policy Gradient (DPG): RL-подход, который оптимизирует генератор синтетических данных на уровне отдельных примеров, используя многошаговые метаградиенты как сигнал награды. Это важно, потому что метод позволяет целенаправленно менять поведение модели через файнтюнинг (вплоть до скрытых эффектов вроде clean-label data poisoning), снижая необходимость в дорогом переобучении с нуля.
Источники: t.me/gonzo_ML
2. LTX готовит релиз LTX-2: dense и MoE-версии, новый text encoder и открытые инструменты обучения
CEO LTX рассказал, что следующий релиз LTX-2 будет нацелен на рост качества и выйдет в двух вариантах (dense и mixture-of-experts) с более мощным text encoder, оптимизациями производительности/памяти и поддержкой low-precision. Также обещаны более открытые trainer-рецепты и инструменты для обучения LoRA, а в исследованиях — diffusion-based decoder вместо VAE для более чёткого вывода и высокого разрешения; при этом заявлено намерение сохранять веса и инструменты открытыми.
Источники: t.me/cgevent
3. Kandinsky отмечает 4 года: рост аудитории и заявленное лидерство Kandinsky 5 Video Pro среди open-source
Команда GigaChat сообщила, что семейству моделей Kandinsky исполнилось 4 года, а число пользователей за год выросло до 17 млн; также приведены объёмы генераций (246 млн картинок и 18 млн видео). Отдельно заявлено, что Kandinsky 5 Video Pro стал топ-1 в мире среди open-source моделей для генерации видео по итогам прошлого года, что подчёркивает конкурентоспособность линейки в видео-генерации.
Источники: t.me/official_gigachat