AI: дайджест за 24 июня 2026

AI: дайджест за 24 июня 2026

1. OpenAI представила собственный инференс-чип Jalapeño

OpenAI показала первый собственный чип Jalapeño, предназначенный исключительно для инференса, и заявила о заметно лучшей эффективности по сравнению с конкурентами. Чип разработан в партнерстве с Broadcom (в одном источнике также упоминается Celestica), сейчас идет тестирование; ожидаются первые деплои к концу 2026 года, продавать или сдавать чипы в аренду компания не планирует.

Источники: t.me/ai_newz, t.me/How2AI

2. Variable-Width Transformers: декодерный трансформер переменной ширины (><former)

В работе Variable-Width Transformers предложена архитектура декодерного трансформера с переменной шириной слоев в форме «галстука-бабочки», где средние слои уже, а первые и последние — шире, с беспараметрическим механизмом carry-forward для изменения размерности. Авторы заявляют снижение затрат на предобучение до 22% по FLOPs и уменьшение KV-кэша на 15% при стабильном превосходстве по качеству на downstream-задачах, но отмечают, что для реального ускорения нужны специализированные кернелы.

Источники: t.me/gonzo_ML

3. Viralbench: бенчмарк для AI-агентов, генерирующих «виральный» контент

Появился бенчмарк Viralbench для оценки агента, который ежедневно анализирует тренды TikTok и публикует карусели с AI-изображениями на «виральные» темы. По текущим результатам в этом тесте лидирует версия 5.5, что может быть ориентиром для маркетинговых сценариев генерации контента.

Источники: t.me/denissexy

Read more

AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в

By Kirill Brusenskiy
AI: дайджест за 3 июля 2026

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы

By Kirill Brusenskiy
AI: дайджест за 2 июля 2026

AI: дайджест за 2 июля 2026

1. Сбер открыл в open source диффузионную языковую модель GFusion и интегрировал её в SGLang Сбер выложил экспериментальную диффузионную LLM GFusion (на базе GigaChat) и сопутствующие инструменты обучения, заявив ускорение генерации текста до 45% относительно GigaChat 3. Важно тем, что это публичный опенсорс-эксперимент с альтернативной (не автогрессивной) схемой генерации и

By Kirill Brusenskiy
AI: дайджест за 1 июля 2026

AI: дайджест за 1 июля 2026

1. Anthropic выпустила Claude Sonnet 5 и сделала его моделью по умолчанию Anthropic представила Claude Sonnet 5: по заявлению компании, он ближе по качеству к Opus 4.8, чем к Sonnet 4.6, и доступен всем пользователям, включая бесплатных. Введена промо-цена до 31 августа ($2/$10 за 1M токенов input/

By Kirill Brusenskiy