AI: дайджест за 9-16 мая 2026
1. OpenAI добавила управление Codex из мобильного ChatGPT
Codex теперь можно запускать и контролировать из мобильного приложения ChatGPT, управляя процессом на ноутбуке или удалённой машине (терминал, тесты, diff) и не давая компьютеру уснуть во время работы агента. Это упрощает использование «долгоиграющих» кодинг-агентов и делает их более практичными в повседневной разработке.
Источники: t.me/How2AI, t.me/denissexy
2. Тест TurboQuant в vLLM: экономит KV-кэш, но часто сильно режет пропускную способность
В блоге vLLM протестировали TurboQuant для квантизации KV-кэша на разных архитектурах: варианты k8v4 и 4bit-nc почти не теряют качество и занимают на 15–35% меньше места, чем fp8-кэш, но 3-битные режимы заметно проседают, особенно на длинном контексте. По скорости метод часто проигрывает из‑за постоянной деквантизации (падение throughput на 10–70%), поэтому выглядит более уместным для локального инференса, чем для серверов.
Источники: t.me/ai_newz
3. SkillClaw: фреймворк для коллективной эволюции навыков LLM-агентов
В работе SkillClaw предложен подход, где навыки агентов становятся динамическими: система собирает логи выполнения от разных пользователей и через «agentic evolver» итеративно улучшает или создаёт процедуры в общей базе. Это важно как способ уменьшить повторение одних и тех же ошибок разными инстансами агентов и накапливать «процедурный интеллект», но требует контроля приватности и увеличивает токенные затраты на валидации.
Источники: t.me/gonzo_ML
4. Исследование Apple: обход safety-alignment возможен через вмешательство в один нейрон
Авторы показали, что механизмы отказа/безопасности в LLM могут быть завязаны на отдельные MLP-нейроны: вмешательство в один «refusal neuron» позволяет обходить защитные барьеры, а усиление одного «нейрона концепта» может провоцировать вредоносные ответы на безобидные запросы. Это ставит под сомнение устойчивость текущих подходов вроде RLHF и указывает на риск «единой точки отказа» при white-box доступе.
Источники: t.me/gonzo_ML
5. Fast Byte Latent Transformer: ускорение байтовых моделей через параллельное декодирование
В работе предложены методы BLT-D, BLT-S и BLT-DV для параллельной генерации байтов (диффузия и внутреннее спекулятивное декодирование), чтобы обойти узкое место авторегрессии в байтовых архитектурах. Заявляется снижение затрат на memory bandwidth до 92% в некоторых конфигурациях, что делает модели без токенизатора более конкурентоспособными по инференсу.
Источники: t.me/gonzo_ML
6. Норникель запустил «ИИ-архитектора» для проектирования заводов и BIM-документации
Сообщается о запуске у «Норникеля» отраслевой системы на базе генеративного ИИ: цифровые агенты анализируют ТЗ, генерируют разделы проектной документации, наполняют BIM-модель и сверяют с нормативами. Заявленный эффект — сокращение сроков выпуска документации вдвое и снижение ошибок, с оценкой экономического эффекта до 10 млрд руб. в год.
Источники: t.me/cgevent
7. AsymFLUX.2 Klein: генерация изображений без VAE, заявлено ускорение на 40%
Представлен AsymFLUX.2 Klein, который работает напрямую в пиксельном пространстве (без VAE), с заявлением о ~40% ускорении и меньшем «мыле». Доступны код и демо, а также заявлена поддержка ComfyUI в ближайшее время.
Источники: t.me/cgevent
8. LTX Director: таймлайн-редактор внутри ComfyUI для I2V/T2V и монтажа
Вышел LTX Director — all-in-one timeline editor для ComfyUI с поддержкой сценариев вроде I2V/T2V, prompt relay, кастомного аудио и других функций монтажа в одном пайплайне. Это расширяет ComfyUI в сторону полноценного видеоредактора на базе генеративных инструментов.
Источники: t.me/cgevent
9. Higgsfield анонсировала Supercomputer — managed long-running агент для контент-продакшна
Higgsfield представила Supercomputer — управляемого long-running агента, ориентированного на контент-продакшн и маркетинг, с persistent context, оркестрацией на форке Hermes и мульти-модельным роутингом. Заявляется использование как сторонних «фронтирных» моделей, так и собственных тюнов, а также кейс с полнометражным фильмом для Каннского фестиваля.
Источники: t.me/ai_newz
10. Полевой тест Higgsfield Supercomputer: проблемы с пайплайном и подтверждением авторства
В пользовательском тесте агент столкнулся с проблемами верификации референсов, падениями TTS-песочницы и ошибками модуля монтажа (ffmpeg), а часть генераций оказалась недоступна из‑за правила подтверждения авторства, которое агент не может выполнить сам. Вывод тестировщика — продукт пока сырой и дорогой по расходу кредитов, пригоден скорее как эксперимент.
Источники: t.me/cgevent
11. СберУниверситет и «Школа 21» запустили «ГигаАкадемию» для обучения работе с ИИ
Анонсирован образовательный проект «ГигаАкадемия», ориентированный на практические навыки работы с ИИ и ИИ-агентами для разных аудиторий (от студентов до руководителей). Открыта запись на двухдневный интенсив, где обещают создать собственного ИИ-ассистента/агента под задачи бизнеса с использованием платформы ГигаЧат Бизнес.
Источники: t.me/official_gigachat