AI: дайджест за 7-14 марта 2026

Kirill Brusenskiy

14 Mar 2026 — 2 min read

1. Claude увеличил контекст до 1 млн токенов по умолчанию и убрал доплату за длинные запросы

Сообщается, что в Claude теперь по умолчанию доступен контекст в 1 миллион токенов, а повышенную цену за запросы сверх определённой длины убрали. Расширенный контекст доступен для Sonnet 4.6 и Opus 4.6 через API и в Claude Code по подпискам Max/Team/Enterprise, но не в обычном чате, что важно для задач с очень длинными документами и кодом.

Источники: t.me/ai_newz

2. В Photoshop Beta появилась AI-функция Rotate Object для поворота 2D-слоёв в 3D

В бете Photoshop добавили функцию Rotate Object, позволяющую «крутить» плоские 2D-изображения/слои в 3D-пространстве. Это расширяет возможности быстрой правки ракурса без ручного 3D-моделинга и может ускорить создание вариаций визуалов.

Источники: t.me/ai_newz, t.me/denissexy, t.me/cgevent

3. В Grok добавили поддержку до 7 референсов для консистентности в видео

Сообщается, что в Grok теперь можно использовать до 7 референсов, и они сохраняются в видео с нормальной консистентностью. Это важно для генерации роликов с устойчивыми персонажами/объектами и стилем между сценами.

Источники: t.me/cgevent

4. ComfyUI App Builder: упаковка workflow в «приложение», но с ограничениями для локального использования

Описан опыт с ComfyUI App Builder: параметры нод можно превратить в поля ввода/слайдеры и получить App View, при этом на диске остаётся JSON с описанием параметров. Отмечено, что корректная работа, вероятно, завязана на Comfy Cloud, а локально остаётся проблема воспроизводимости из‑за отсутствующих нод/моделей и неочевидной установки зависимостей.

Источники: t.me/cgevent

5. Cascadeur: локальная AI-интерполяция анимации между позами без подписок и кредитов

В последней версии Cascadeur ИИ интерактивно строит промежуточную анимацию между заданными позами, позволяя править ключевые и добавлять промежуточные точки. Подчёркивается, что генерация происходит локально и входит в стоимость лицензии, что важно для студий, которым критичны автономность и предсказуемые затраты.

Источники: t.me/cgevent

6. Исследование FlashAttention-4: оптимизация точного внимания под NVIDIA Blackwell

Вышла работа FlashAttention-4 с ко-дизайном алгоритма и kernel-пайплайна, заточенная под архитектуру NVIDIA Blackwell (B200/GB200), где узкими местами становятся не тензорные ядра, а «обычная» математика и экспоненты. Авторы заявляют производительность до 1613 TFLOPs/s, что важно для эффективного обучения и инференса моделей с длинным контекстом на новом поколении GPU.

Источники: t.me/gonzo_ML

7. FAIR/NYU исследовали унифицированное мультимодальное предобучение с нуля и роль MoE

Опубликована работа о мультимодальном предобучении с единым бэкбоном: текст обучают как предсказание следующего токена, а зрение — через flow matching, при этом Representation Autoencoder (RAE) подходит и для понимания, и для генерации. Авторы показывают, что MoE помогает справляться с асимметрией модальностей и что некоторые способности (включая элементы world modeling) могут появляться zero-shot за счёт общего мультимодального предобучения, что важно для проектирования «нативно» мультимодальных моделей.

Источники: t.me/gonzo_ML

8. Реконструкция видео по сигналам зрительной коры мыши стала вдвое точнее

Сообщается о модели, которая восстанавливает видеоряд по активности зрительной коры у мыши, причём точность реконструкции выросла вдвое относительно прошлых попыток. Это важно для исследований восприятия и потенциальных применений в нейроинтерфейсах, включая помощь людям с параличом.

Источники: t.me/denissexy

9. Сообщается, что OpenAI может встроить Sora в приложение ChatGPT

По сообщению СМИ, OpenAI рассматривает интеграцию Sora (генерации видео) прямо в ChatGPT. Если это произойдёт, видеогенерация станет доступнее внутри основного продукта, но в источнике не упоминаются улучшения самой Sora.

Источники: t.me/cgevent

10. GigaChat заявил о сдаче трёх медицинских экзаменов по клиническим кейсам

Официальный канал GigaChat сообщает, что модель успешно прошла испытания по фармакологии, пульмонологии и педиатрии на заданиях с реальными клиническими кейсами. Это используется как сигнал о расширении заявленной компетенции в медицинских сценариях, хотя деталей методики и метрик в сообщении нет.

Источники: t.me/official_gigachat

11. Вышел open-source «скилл» для кодинг-агентов, генерирующий ролики в стиле YouTube Poop

Опубликован репозиторий, который собирает популярные стили YouTube Poop в устанавливаемый «скилл» для агентных систем, чтобы генерировать короткие видео на заданные темы. Это показывает, как кодинг-агенты можно применять для автоматизации специфических форматов видеомонтажа.

Источники: t.me/denissexy

AI: дайджест за 7-14 марта 2026

Kirill Brusenskiy

1. Claude увеличил контекст до 1 млн токенов по умолчанию и убрал доплату за длинные запросы

2. В Photoshop Beta появилась AI-функция Rotate Object для поворота 2D-слоёв в 3D

3. В Grok добавили поддержку до 7 референсов для консистентности в видео

4. ComfyUI App Builder: упаковка workflow в «приложение», но с ограничениями для локального использования

5. Cascadeur: локальная AI-интерполяция анимации между позами без подписок и кредитов

6. Исследование FlashAttention-4: оптимизация точного внимания под NVIDIA Blackwell

7. FAIR/NYU исследовали унифицированное мультимодальное предобучение с нуля и роль MoE

8. Реконструкция видео по сигналам зрительной коры мыши стала вдвое точнее

9. Сообщается, что OpenAI может встроить Sora в приложение ChatGPT

10. GigaChat заявил о сдаче трёх медицинских экзаменов по клиническим кейсам

11. Вышел open-source «скилл» для кодинг-агентов, генерирующий ролики в стиле YouTube Poop

Read more

AI: дайджест за 5 июля 2026

AI: дайджест за 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 3 июля 2026