AI: дайджест за 6 июня 2026

AI: дайджест за 6 июня 2026

1. Microsoft раскрыла детали обучения MAI-Thinking-1 (MoE LLM с reasoning)

Microsoft опубликовала подробный техрепорт о тренировке MAI-Thinking-1 — MoE-модели с 35B active / 1T total параметров и контекстом 256k токенов, обученной на кластере из 8000 GB200. Важность в том, что Big Tech редко делится таким уровнем инженерных деталей; модель не обещают открыть в open-source, но планируют дать API для финтюна.

Источники: t.me/ai_newz

2. Исследование Ahrefs: что реально влияет на цитирование сайтов AI-ассистентами и как AI Overviews меняют клики

Ahrefs по данным 14 исследований и более 1 млрд точек показали, какие типы страниц и факторы связаны с цитированием в ChatGPT/AI-ответах: заметную долю дают «топ‑X» подборки, значительная часть цитирований приходится на источники вроде Wikipedia и главных страниц, а schema-разметка почти не влияет. Также отмечено, что Google AI Overviews существенно снижают клики по первому результату и что источники в AI Mode и AI Overviews часто различаются при схожих выводах, что меняет подход к SEO и контент-стратегии.

Источники: t.me/denissexy

3. q0: фреймворк для сверхмногоэпохового предобучения при дефиците данных

В работе q0 предложен подход к предобучению при ограниченных данных и избытке вычислений: параллельные циклические расписания, chain distillation и «generalization prior» для пула дополняющих моделей вместо «полировки» одной. Авторы заявляют рост эффективности использования данных до 12,9× и улучшения на бенчмарках до 16×, что важно для сценариев, где качественные данные становятся узким местом.

Источники: t.me/gonzo_ML

4. GigaChat представил GigaNetwork и набор AI-решений для бизнеса на ПМЭФ

В рамках ПМЭФ команда GigaChat заявила о запуске GigaNetwork — платформы, где AI-агенты компаний могут вести переговоры и заключать сделки, а также представила ряд AI-решений для бизнеса (включая оптический вычислитель, банкомат нового поколения и платёжный терминал с ИИ) и AI-помощника для участников форума. Важность в том, что это расширяет линейку прикладных корпоративных AI-продуктов и сценариев автоматизации.

Источники: t.me/official_gigachat

Read more

AI: дайджест за 4 июля 2026

AI: дайджест за 4 июля 2026

1. DeepSeek представила DSpark для ускорения спекулятивного декодирования Команда DeepSeek-AI описала фреймворк DSpark: полуавторегрессионный параллельный «драфтер» и шедулер префиксов на основе уверенности, чтобы ускорять инференс LLM под высокой конкурентной нагрузкой. Заявлено ускорение генерации на 60–85% для DeepSeek-V4 при сохранении пропускной способности и без деградации качества в «хвосте» последовательности; код

By Kirill Brusenskiy
AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в

By Kirill Brusenskiy
AI: дайджест за 3 июля 2026

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы

By Kirill Brusenskiy
AI: дайджест за 2 июля 2026

AI: дайджест за 2 июля 2026

1. Сбер открыл в open source диффузионную языковую модель GFusion и интегрировал её в SGLang Сбер выложил экспериментальную диффузионную LLM GFusion (на базе GigaChat) и сопутствующие инструменты обучения, заявив ускорение генерации текста до 45% относительно GigaChat 3. Важно тем, что это публичный опенсорс-эксперимент с альтернативной (не автогрессивной) схемой генерации и

By Kirill Brusenskiy