AI: дайджест за 25 мая 2026

AI: дайджест за 25 мая 2026

1. Anthropic: модель Mythos нашла 271 уязвимость в Firefox за месяц

Сообщается, что модель Mythos от Anthropic за месяц обнаружила 271 уязвимость в Firefox, включая критические, превзойдя результаты человеческих разработчиков за полтора года. Это усиливает аргумент, что LLM могут существенно ускорять аудит безопасности и поиск багов в больших кодовых базах.

Источники: t.me/ai_newz

2. Claude Code получил мульти-агентный режим и команду /goal

В Claude Code появился мульти-агентный режим, а также режим /goal, в котором модель продолжает работу до достижения цели. Это важно для автоматизации длинных задач разработки и приближает Claude к конкурентам в агентных сценариях.

Источники: t.me/ai_newz

3. Anthropic обещает подписчикам до $200 API-кредитов для сторонних приложений

Anthropic планирует выдавать подписчикам токены (до $200) для использования в сторонних инструментах на базе Agent SDK. Это может стимулировать экосистему приложений вокруг Claude и снизить барьер для проб агентных продуктов.

Источники: t.me/ai_newz

4. vLLM: квантизация KV-кэша может обрушить серверную пропускную способность до 70%

В vLLM детально протестировали квантизацию KV-кэша и пришли к выводу, что для локального инференса она подходит, но на серверах деквантизация может снижать throughput до 70%. Это важный сигнал для команд, оптимизирующих стоимость и производительность продакшен-инференса.

Источники: t.me/ai_newz

5. Cursor выпустил Composer 2.5 на базе K2.5, fast-режим подорожал вдвое

Cursor представил Composer 2.5 (на базе K2.5): заявлено улучшение качества, но стоимость fast-режима выросла в 2 раза и стала сопоставима с Sonnet. Это отражает общий тренд: рост агентных возможностей часто сопровождается заметным удорожанием.

Источники: t.me/ai_newz

6. Вышла Gemini 3.5 Flash с упором на агентность, цены выросли в 3 раза

Сообщается о релизе Gemini 3.5 Flash: модель стала заметно умнее и ориентирована на агентные сценарии, но стоимость увеличилась примерно в 3 раза относительно прошлой версии. Для пользователей это означает пересмотр экономики задач, где важна скорость и массовые вызовы.

Источники: t.me/ai_newz

7. Cerebras запустила Kimi K2.6 с заявленной скоростью 1000 ток/с на «триллионнике» (enterprise)

Cerebras объявила запуск Kimi K2.6 с заявленной скоростью около 1000 токенов/с на модели триллионного масштаба, пока только для enterprise-клиентов. Это важно как демонстрация предельной пропускной способности специализированной инфраструктуры для LLM.

Источники: t.me/ai_newz

8. OpenAI: фикс лимитов в Codex и тизер режима /slow для больших несрочных задач

OpenAI пофиксили баг в Codex, из-за которого «съедались» лимиты, и тизерят режим /slow для объемных несрочных задач. Это указывает на развитие режимов работы под разные профили стоимости/скорости и улучшение надежности инструмента.

Источники: t.me/ai_newz

9. Google выпустила Gemini Omni: заявлено, что модель сама умеет видеогенерацию

В дайджесте утверждается, что Google выпустила Gemini Omni, и теперь модель умеет видеогенерацию, что подается как «смерть линейки Veo». Если это так, то видео становится нативной модальностью в общей модели, упрощая продуктовую интеграцию.

Источники: t.me/ai_newz

10. Anthropic арендует датацентр Colossus у SpaceX; подписчикам Claude подняли лимиты

Сообщается о партнерстве: Anthropic арендует датацентр Colossus у SpaceX, а в ответ лимиты для подписчиков Claude увеличили вдвое. Это важно как индикатор дефицита вычислений и усиления связки AI-компаний с крупными инфраструктурными игроками.

Источники: t.me/ai_newz

11. Bun: миграция рантайма с Zig на Rust за 10 дней с помощью Claude

Лид-разработчик Bun, по сообщению, полностью переписал рантайм с Zig на Rust за 10 дней при помощи Claude; новая версия заявлена как более стабильная и быстрая. Это показательный кейс ускорения крупных рефакторингов с LLM в роли «ускорителя разработки».

Источники: t.me/ai_newz

12. OpenClaw: счет за токены $1,3 млн/мес из-за сотни агентов для ревью, митингов и кода

Создатели OpenClaw, по сообщению, используют около сотни агентов (ревью PR, прослушивание митингов, написание кода), что приводит к расходам на токены порядка $1,3 млн в месяц. Это демонстрирует, что агентные подходы быстро упираются в экономику инференса и требуют оптимизации.

Источники: t.me/ai_newz

13. Дефицит GPU: аренда H100 почти недоступна, A100 подорожали

В дайджесте утверждается, что в мире заканчиваются GPU: H100 сложно арендовать, а старые A100 стоят дороже, чем два года назад, при этом «неоклауды» отдают мощности крупным игрокам. Это влияет на планы масштабирования AI-продуктов и стоимость обучения/инференса.

Источники: t.me/ai_newz

14. Андрей Карпатый присоединился к Anthropic

Сообщается, что Андрей Карпатый официально присоединился к Anthropic. Это заметное кадровое событие для рынка frontier-лабораторий и сигнал о конкуренции за исследовательские таланты.

Источники: t.me/ai_newz

15. MoonPay в ChatGPT: по сути это приложение-каталог с переходом на внешний сервис, не оплата внутри

Обсуждаемая «покупка крипты в ChatGPT» сводится к приложению MoonPay в каталоге: пользователь получает ссылку и уходит на сторону MoonPay, где и происходят платежи, KYC и юрисдикционные проверки. Важно как уточнение: это не нативная крипто-оплата внутри ChatGPT, а маркетинговый эффект от интеграции в App Store.

Источники: t.me/cgevent

16. PettiChat: AI-ошейник «переводчик» для питомцев на базе Qwen, заявляют 95% точности и 10k предзаказов

Китайский стартап Meng Xiaoyi представил ошейник PettiChat, который якобы переводит звуки и эмоции собак/кошек с точностью до 95%, используя датчики и модель Qwen; заявлены цена $118 и более 10 000 предзаказов. Это пример потребительского AI-гаджета с громкими метриками, важный как индикатор спроса и риска завышенных обещаний.

Источники: t.me/cgevent

17. ByteDance выпустила Video Upscaler vCube: до 4K/60fps, доступ через API, PRO-mode в 10 раз дороже

Анонсирован ByteDance Video Upscaler vCube: апскейл с 480p/720p/1080p до 2K/4K, до 60 fps, без опенсорса — только API; приведены тарифы, где PRO-mode стоит в 10 раз дороже. Это важно для продакшен-пайплайнов видео: появляется коммерческий апскейлер с прозрачной экономикой по секундам.

Источники: t.me/cgevent

18. Исследование: агентные системы как test-time boosting могут подтянуть слабую модель до уровня SOTA на задачах кода

В работе «Agentic Systems as Boosting Weak Reasoning Models» предложен теоретический фреймворк, связывающий committee search с бустингом на инференсе; утверждается, что легковесную модель (упоминается GPT-5.4 nano) можно оркестрацией критиков/компараторов довести до уровня лучших коммерческих моделей на бенчмарках по разработке ПО. Это важно как аргумент в пользу «программного масштабирования» вместо наращивания параметров.

Источники: t.me/gonzo_ML

19. DMax для диффузионных LLM: параллельное декодирование с ускорением >2,5× и скоростью >1300 ток/с на 2×H200

В статье про DMax предложены OPUT и Soft Parallel Decoding, чтобы уменьшить накопление ошибок при агрессивном параллельном декодировании в dLLM; заявлено ускорение более чем в 2,5 раза на GSM8K/MBPP при минимальной потере точности и скорость свыше 1300 ток/с на двух H200. Это важно для практического ускорения генерации без сильной деградации качества.

Источники: t.me/gonzo_ML

20. Папа Римский призвал к «разоружению» ИИ и жесткому регулированию в энциклике

Сообщается о презентации энциклики, где Папа призвал не допускать принятия ИИ необратимых или летальных решений и усилить регулирование ради общего блага; также прозвучала мысль, что «более морального ИИ недостаточно, если мораль определяют немногие». Это важно как усиление религиозно-этического давления на политику регулирования AI.

Источники: t.me/denissexy

Read more

AI: дайджест за 4 июля 2026

AI: дайджест за 4 июля 2026

1. DeepSeek представила DSpark для ускорения спекулятивного декодирования Команда DeepSeek-AI описала фреймворк DSpark: полуавторегрессионный параллельный «драфтер» и шедулер префиксов на основе уверенности, чтобы ускорять инференс LLM под высокой конкурентной нагрузкой. Заявлено ускорение генерации на 60–85% для DeepSeek-V4 при сохранении пропускной способности и без деградации качества в «хвосте» последовательности; код

By Kirill Brusenskiy
AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в

By Kirill Brusenskiy
AI: дайджест за 3 июля 2026

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы

By Kirill Brusenskiy
AI: дайджест за 2 июля 2026

AI: дайджест за 2 июля 2026

1. Сбер открыл в open source диффузионную языковую модель GFusion и интегрировал её в SGLang Сбер выложил экспериментальную диффузионную LLM GFusion (на базе GigaChat) и сопутствующие инструменты обучения, заявив ускорение генерации текста до 45% относительно GigaChat 3. Важно тем, что это публичный опенсорс-эксперимент с альтернативной (не автогрессивной) схемой генерации и

By Kirill Brusenskiy