AI: дайджест за 24 мая 2026

AI: дайджест за 24 мая 2026

1. OpenAI исправила баг с кэшем в Codex и обсуждает режим /slow

Сообщается, что в Codex исправили проблему с кэшем, из‑за которой быстро расходовалиcь лимиты, и лимиты «снова ресетнули». Также упоминается тизер режима /slow для несрочных объёмных задач, что может улучшить удобство работы с Codex при больших запросах.

Источники: t.me/ai_newz

2. LT2: Linear-Time Looped Transformers — зацикленные трансформеры с линейным/разреженным вниманием

Вышла работа LT2 (Linear-Time Looped Transformers): семейство рекурсивных (зацикленных) трансформеров, где квадратичное softmax-внимание заменяют на субквадратичные/линейные/разреженные механизмы смешивания токенов, плюс предложены гибриды по глубине и шагам цикла. Авторы утверждают, что это снижает рост вычислений и KV-cache на длинном контексте и даёт практический рецепт дистилляции из «тяжёлых» моделей в более быстрые (заявлено ускорение инференса в 5–6 раз) без потери качества на длинном контексте.

Источники: t.me/gonzo_ML

Read more

AI: дайджест за 4 июля 2026

AI: дайджест за 4 июля 2026

1. DeepSeek представила DSpark для ускорения спекулятивного декодирования Команда DeepSeek-AI описала фреймворк DSpark: полуавторегрессионный параллельный «драфтер» и шедулер префиксов на основе уверенности, чтобы ускорять инференс LLM под высокой конкурентной нагрузкой. Заявлено ускорение генерации на 60–85% для DeepSeek-V4 при сохранении пропускной способности и без деградации качества в «хвосте» последовательности; код

By Kirill Brusenskiy
AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в

By Kirill Brusenskiy
AI: дайджест за 3 июля 2026

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы

By Kirill Brusenskiy
AI: дайджест за 2 июля 2026

AI: дайджест за 2 июля 2026

1. Сбер открыл в open source диффузионную языковую модель GFusion и интегрировал её в SGLang Сбер выложил экспериментальную диффузионную LLM GFusion (на базе GigaChat) и сопутствующие инструменты обучения, заявив ускорение генерации текста до 45% относительно GigaChat 3. Важно тем, что это публичный опенсорс-эксперимент с альтернативной (не автогрессивной) схемой генерации и

By Kirill Brusenskiy