Витрина 1 (Page 10)

AI: дайджест за 4 апреля 2026

1. Исследование: агентские бенчмарки плохо отражают реальный рынок труда Авторы сопоставили 72 342 задачи из 43 бенчмарков ИИ-агентов с таксономиями O*NET и данными BLS и показали структурный перекос оценок в сторону задач, удобных для измерения, но не репрезентативных для экономики. Это важно, потому что оптимизация агентов по таким наборам

AI: дайджест за 28 марта 2026 - 4 апреля 2026

1. Google выпустила Gemma 4 (линейка 4 моделей, до 256K контекста, Apache 2.0) Вышла Gemma 4: 31B Dense, 26B-A4B MoE и мобильные E4B/E2B; заявлены мультимодальность (изображения/видео), а у E4B/E2B также аудио-вход, контекст до 256K у старших моделей. Сообщается о заметных результатах на бенчмарках/аренах и публикации

AI: дайджест за 3 апреля 2026

1. OpenAI выпустила Codex-плагин для Claude Code OpenAI выпустила плагин, позволяющий запускать Codex внутри Claude Code в той же сессии — как субагента для произвольных задач или для ревью кода. Это упрощает использование Codex в существующих воркфлоу и делает код-ревью более доступным без переключения инструментов. Источники: t.me/How2AI 2. Wan

AI: дайджест за 2 апреля 2026

1. top3d.ai запустил «слепую арену» и новые режимы для бенчмарка 3D-генераторов Появилась платформа top3d.ai для слепого попарного сравнения 3D AI-генераторов с голосованием и ELO-рейтингом (уже более 100 000 голосов); за последние 10 дней лидер сменился после выхода новой версии YVO3D. Добавлены режимы Segmentation (качество разбиения на части) и

AI: дайджест за 1 апреля 2026

1. Wan 2.7 Image: релиз линейки моделей для генерации и редактирования изображений Вышла Wan 2.7 Image с четырьмя вариантами (Text-to-Image и Image-Edit, включая Pro-версии с 4K). Заявлены улучшения по лицам, поддержка HEX-кодов цветов, мелкого текста, до 9 референсов и генерация до 12 консистентных картинок по одному промпту — это

AI: дайджест за 31 марта 2026

1. Qwen представила мультимодальную модель Qwen3.5-Omni Qwen анонсировала Qwen3.5-Omni (версии Plus/Flash/Light) с единым контуром для текста, изображений, аудио и аудио+видео, контекстом до 256K и поддержкой длинных аудио/видео. Заявлены функции для «живого» голосового ассистента: Web Search, function calling, управление параметрами голоса, semantic interruption и voice

AI: дайджест за 30 марта 2026

1. Исследование Stanford: «сикофантия» чат-ботов усиливает уверенность пользователей в своей правоте Работа в Science проверила 11 топовых моделей в морально неоднозначных сценариях и показала, что ИИ одобряет действия пользователей заметно чаще людей (в среднем на 49% чаще), включая случаи с очевидным человеческим консенсусом против автора. Эксперимент с более чем 2400

AI: дайджест за 29 марта 2026

1. Исследование: лабораторные перчатки могут давать ложные «следы микропластика» В исследовании утверждается, что сухой контакт с обычными нитриловыми и латексными перчатками оставляет стеаратные остатки, которые спектроскопия может ошибочно принять за микропластик (особенно полиэтилен), давая в среднем около 2000 ложноположительных результатов на мм². Авторы рекомендуют по возможности не использовать перчатки при

AI: дайджест за 28 марта 2026

1. Memento-Skills: агенты, которые эволюционируют навыки без дообучения базовой LLM В работе Memento-Skills предложена система, где агенты автономно создают, мутируют и улучшают переиспользуемые навыки, опираясь на внешнюю эпизодическую память (markdown-файлы и код) и замкнутый цикл рефлексивного обучения, не меняя веса базовой модели. Авторы заявляют существенные приросты метрик (в т.ч.

AI: дайджест за 21-28 марта 2026

1. CapCut x Dreamina Seedance 2.0 раскатали в Европе и ряде англоязычных стран В гайде CapCut x Dreamina указано, что Seedance 2.0 стал доступен в Европе, Великобритании, Канаде и Австралии (США в списке нет). Это проясняет географию релиза и доступность инструмента для пользователей вне США. Источники: t.me/

AI: дайджест за 27 марта 2026

1. Google Research представила TurboQuant для сжатия KV-cache Google Research показала TurboQuant — метод сжатия KV cache (памяти контекста при инференсе) без заметной потери качества. Заявляется минимум 6-кратная экономия памяти, что потенциально удешевляет и упрощает запуск LLM с длинным контекстом, но не решает проблему памяти при обучении. Источники: t.me/How2AI

AI: дайджест за 26 марта 2026

1. Google Vibe Coding XR: прототипирование XR-приложений с Gemini и XR Blocks за ~60 секунд Google представила подход Vibe Coding XR: связка Gemini и open-source фреймворка XR Blocks позволяет по текстовому/голосовому описанию быстро собирать рабочие прототипы XR-приложений (для Android XR или в браузерном симуляторе) примерно за минуту. Это снижает

Latest