Краткий дайджест новостей в области ИИ
Обзор актуальных событий и исследований в сфере искусственного интеллекта.
- Обнаружена проблема с генерализацией новых методов на различных моделях, несмотря на высокие метрики на Qwen-2.5.
- Проведены эксперименты с Qwen-2.5-Math-7B, OLMo-2 и Llama-3.1-8B для выделения бенчмарков.
- На 21-22 слоях моделей наблюдается пик верного ответа при анализе заликанного вопроса из MATH-500.
- Метрики моделей значительно улучшились на MinervaMath и MATH-500 после применения новых методов.
- В Reddit обсуждают ухудшение качества работы Нано Банана Про, включая следование промтам и цензуру.
Подробности по ссылке: https://pro.rbc.ru/demo/…