AI: дайджест за 14 июня 2026
1. Новый метод DPG для генерации синтетических датасетов под любую дифференцируемую цель В работе «Synthetic Data for any Differentiable Target» представлен Dataset Policy Gradient (DPG): RL-подход, который оптимизирует генератор синтетических данных на уровне отдельных примеров, используя многошаговые метаградиенты как сигнал награды. Это важно, потому что метод позволяет целенаправленно менять поведение