AI: дайджест за 24 июня 2026
1. OpenAI представила собственный инференс-чип Jalapeño
OpenAI показала первый собственный чип Jalapeño, предназначенный исключительно для инференса, и заявила о заметно лучшей эффективности по сравнению с конкурентами. Чип разработан в партнерстве с Broadcom (в одном источнике также упоминается Celestica), сейчас идет тестирование; ожидаются первые деплои к концу 2026 года, продавать или сдавать чипы в аренду компания не планирует.
Источники: t.me/ai_newz, t.me/How2AI
2. Variable-Width Transformers: декодерный трансформер переменной ширины (><former)
В работе Variable-Width Transformers предложена архитектура декодерного трансформера с переменной шириной слоев в форме «галстука-бабочки», где средние слои уже, а первые и последние — шире, с беспараметрическим механизмом carry-forward для изменения размерности. Авторы заявляют снижение затрат на предобучение до 22% по FLOPs и уменьшение KV-кэша на 15% при стабильном превосходстве по качеству на downstream-задачах, но отмечают, что для реального ускорения нужны специализированные кернелы.
Источники: t.me/gonzo_ML
3. Viralbench: бенчмарк для AI-агентов, генерирующих «виральный» контент
Появился бенчмарк Viralbench для оценки агента, который ежедневно анализирует тренды TikTok и публикует карусели с AI-изображениями на «виральные» темы. По текущим результатам в этом тесте лидирует версия 5.5, что может быть ориентиром для маркетинговых сценариев генерации контента.
Источники: t.me/denissexy