AI: дайджест за 9-16 мая 2026

AI: дайджест за 9-16 мая 2026

1. OpenAI добавила управление Codex из мобильного ChatGPT

Codex теперь можно запускать и контролировать из мобильного приложения ChatGPT, управляя процессом на ноутбуке или удалённой машине (терминал, тесты, diff) и не давая компьютеру уснуть во время работы агента. Это упрощает использование «долгоиграющих» кодинг-агентов и делает их более практичными в повседневной разработке.

Источники: t.me/How2AI, t.me/denissexy

2. Тест TurboQuant в vLLM: экономит KV-кэш, но часто сильно режет пропускную способность

В блоге vLLM протестировали TurboQuant для квантизации KV-кэша на разных архитектурах: варианты k8v4 и 4bit-nc почти не теряют качество и занимают на 15–35% меньше места, чем fp8-кэш, но 3-битные режимы заметно проседают, особенно на длинном контексте. По скорости метод часто проигрывает из‑за постоянной деквантизации (падение throughput на 10–70%), поэтому выглядит более уместным для локального инференса, чем для серверов.

Источники: t.me/ai_newz

3. SkillClaw: фреймворк для коллективной эволюции навыков LLM-агентов

В работе SkillClaw предложен подход, где навыки агентов становятся динамическими: система собирает логи выполнения от разных пользователей и через «agentic evolver» итеративно улучшает или создаёт процедуры в общей базе. Это важно как способ уменьшить повторение одних и тех же ошибок разными инстансами агентов и накапливать «процедурный интеллект», но требует контроля приватности и увеличивает токенные затраты на валидации.

Источники: t.me/gonzo_ML

4. Исследование Apple: обход safety-alignment возможен через вмешательство в один нейрон

Авторы показали, что механизмы отказа/безопасности в LLM могут быть завязаны на отдельные MLP-нейроны: вмешательство в один «refusal neuron» позволяет обходить защитные барьеры, а усиление одного «нейрона концепта» может провоцировать вредоносные ответы на безобидные запросы. Это ставит под сомнение устойчивость текущих подходов вроде RLHF и указывает на риск «единой точки отказа» при white-box доступе.

Источники: t.me/gonzo_ML

5. Fast Byte Latent Transformer: ускорение байтовых моделей через параллельное декодирование

В работе предложены методы BLT-D, BLT-S и BLT-DV для параллельной генерации байтов (диффузия и внутреннее спекулятивное декодирование), чтобы обойти узкое место авторегрессии в байтовых архитектурах. Заявляется снижение затрат на memory bandwidth до 92% в некоторых конфигурациях, что делает модели без токенизатора более конкурентоспособными по инференсу.

Источники: t.me/gonzo_ML

6. Норникель запустил «ИИ-архитектора» для проектирования заводов и BIM-документации

Сообщается о запуске у «Норникеля» отраслевой системы на базе генеративного ИИ: цифровые агенты анализируют ТЗ, генерируют разделы проектной документации, наполняют BIM-модель и сверяют с нормативами. Заявленный эффект — сокращение сроков выпуска документации вдвое и снижение ошибок, с оценкой экономического эффекта до 10 млрд руб. в год.

Источники: t.me/cgevent

7. AsymFLUX.2 Klein: генерация изображений без VAE, заявлено ускорение на 40%

Представлен AsymFLUX.2 Klein, который работает напрямую в пиксельном пространстве (без VAE), с заявлением о ~40% ускорении и меньшем «мыле». Доступны код и демо, а также заявлена поддержка ComfyUI в ближайшее время.

Источники: t.me/cgevent

8. LTX Director: таймлайн-редактор внутри ComfyUI для I2V/T2V и монтажа

Вышел LTX Director — all-in-one timeline editor для ComfyUI с поддержкой сценариев вроде I2V/T2V, prompt relay, кастомного аудио и других функций монтажа в одном пайплайне. Это расширяет ComfyUI в сторону полноценного видеоредактора на базе генеративных инструментов.

Источники: t.me/cgevent

9. Higgsfield анонсировала Supercomputer — managed long-running агент для контент-продакшна

Higgsfield представила Supercomputer — управляемого long-running агента, ориентированного на контент-продакшн и маркетинг, с persistent context, оркестрацией на форке Hermes и мульти-модельным роутингом. Заявляется использование как сторонних «фронтирных» моделей, так и собственных тюнов, а также кейс с полнометражным фильмом для Каннского фестиваля.

Источники: t.me/ai_newz

10. Полевой тест Higgsfield Supercomputer: проблемы с пайплайном и подтверждением авторства

В пользовательском тесте агент столкнулся с проблемами верификации референсов, падениями TTS-песочницы и ошибками модуля монтажа (ffmpeg), а часть генераций оказалась недоступна из‑за правила подтверждения авторства, которое агент не может выполнить сам. Вывод тестировщика — продукт пока сырой и дорогой по расходу кредитов, пригоден скорее как эксперимент.

Источники: t.me/cgevent

11. СберУниверситет и «Школа 21» запустили «ГигаАкадемию» для обучения работе с ИИ

Анонсирован образовательный проект «ГигаАкадемия», ориентированный на практические навыки работы с ИИ и ИИ-агентами для разных аудиторий (от студентов до руководителей). Открыта запись на двухдневный интенсив, где обещают создать собственного ИИ-ассистента/агента под задачи бизнеса с использованием платформы ГигаЧат Бизнес.

Источники: t.me/official_gigachat

Read more

AI: дайджест за 5 июля 2026

AI: дайджест за 5 июля 2026

1. HOLA: «гиппокамп» для линейного внимания с точной эпизодической памятью В работе «A Hippocampus for Linear Attention» предложена архитектура Hippocampal Linear Attention (HOLA): к рекуррентной state-space основе добавляется небольшой точный KV-кэш, который сохраняет наиболее «удивительные» токены по метрике из остатка дельта-правила. Это снижает перплексию на Wikitext-103 на 16,1% и

By Kirill Brusenskiy
AI: дайджест за 4 июля 2026

AI: дайджест за 4 июля 2026

1. DeepSeek представила DSpark для ускорения спекулятивного декодирования Команда DeepSeek-AI описала фреймворк DSpark: полуавторегрессионный параллельный «драфтер» и шедулер префиксов на основе уверенности, чтобы ускорять инференс LLM под высокой конкурентной нагрузкой. Заявлено ускорение генерации на 60–85% для DeepSeek-V4 при сохранении пропускной способности и без деградации качества в «хвосте» последовательности; код

By Kirill Brusenskiy
AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в

By Kirill Brusenskiy
AI: дайджест за 3 июля 2026

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы

By Kirill Brusenskiy