Краткий дайджест новостей в области ИИ
Обзор актуальных событий и исследований в сфере искусственного интеллекта.
- Исследования показывают, что новые методы не всегда хорошо работают на разных моделях, несмотря на высокие метрики на Qwen-2.5.
- Эксперименты с Qwen-2.5-Math-7B, OLMo-2 и Llama-3.1-8B выявили три ключевых бенчмарка для оценки результатов.
- Анализ логитов показал, что на определённых слоях моделей наблюдаются пики верных ответов.
- Метрики моделей значительно выросли на MinervaMath и MATH-500.
- В Reddit сообщают о ухудшении работы Нано Банана Про, включая снижение качества и агрессивную цензуру.
Узнайте больше о последних исследованиях в области ИИ на [нашем сайте](https://pro.rbc.ru/demo/)!