Краткий дайджест новостей в области ИИ
Обзор ключевых событий и исследований в сфере искусственного интеллекта.
- Проблема спурийных наград в методах GRPO: новые модели показывают высокие метрики на Qwen-2.5, но не генерализуются на другие модели.
- Эксперименты с Qwen-2.5-Math-7B, OLMo-2 и Llama-3.1-8B выявили три бенчмарка для проверки результатов.
- Анализ Logit Lens показал, что на 21-22 слоях моделей наблюдается пик верного ответа.
- Метрики моделей значительно выросли на MinervaMath и MATH-500.
- В Reddit обсуждают ухудшение работы Нано Банана Про, включая качество и цензуру.
Для подробной информации и анализа, посетите [наш канал](https://t.me/gonzo_ML/4701).