AI: дайджест за 24 мая 2026
1. OpenAI исправила баг с кэшем в Codex и обсуждает режим /slow
Сообщается, что в Codex исправили проблему с кэшем, из‑за которой быстро расходовалиcь лимиты, и лимиты «снова ресетнули». Также упоминается тизер режима /slow для несрочных объёмных задач, что может улучшить удобство работы с Codex при больших запросах.
Источники: t.me/ai_newz
2. LT2: Linear-Time Looped Transformers — зацикленные трансформеры с линейным/разреженным вниманием
Вышла работа LT2 (Linear-Time Looped Transformers): семейство рекурсивных (зацикленных) трансформеров, где квадратичное softmax-внимание заменяют на субквадратичные/линейные/разреженные механизмы смешивания токенов, плюс предложены гибриды по глубине и шагам цикла. Авторы утверждают, что это снижает рост вычислений и KV-cache на длинном контексте и даёт практический рецепт дистилляции из «тяжёлых» моделей в более быстрые (заявлено ускорение инференса в 5–6 раз) без потери качества на длинном контексте.
Источники: t.me/gonzo_ML