AI: дайджест за 7-14 марта 2026
Вышел open-source «скилл» для кодинг-агентов, генерирующий ролики в стиле YouTube Poop
Опубликован репозиторий, который собирает популярные стили YouTube Poop в устанавливаемый «скилл» для агентных систем, чтобы генерировать короткие видео на заданные темы. Это показывает, как кодинг-агенты можно применять для автоматизации специфических форматов видеомонтажа.Источники: t.me/denissexy
GigaChat заявил о сдаче трёх медицинских экзаменов по клиническим кейсам
Официальный канал GigaChat сообщает, что модель успешно прошла испытания по фармакологии, пульмонологии и педиатрии на заданиях с реальными клиническими кейсами. Это используется как сигнал о расширении заявленной компетенции в медицинских сценариях, хотя деталей методики и метрик в сообщении нет.Источники: t.me/official_gigachat
Сообщается, что OpenAI может встроить Sora в приложение ChatGPT
По сообщению СМИ, OpenAI рассматривает интеграцию Sora (генерации видео) прямо в ChatGPT. Если это произойдёт, видеогенерация станет доступнее внутри основного продукта, но в источнике не упоминаются улучшения самой Sora.Источники: t.me/cgevent
Реконструкция видео по сигналам зрительной коры мыши стала вдвое точнее
Сообщается о модели, которая восстанавливает видеоряд по активности зрительной коры у мыши, причём точность реконструкции выросла вдвое относительно прошлых попыток. Это важно для исследований восприятия и потенциальных применений в нейроинтерфейсах, включая помощь людям с параличом.Источники: t.me/denissexy
FAIR/NYU исследовали унифицированное мультимодальное предобучение с нуля и роль MoE
Опубликована работа о мультимодальном предобучении с единым бэкбоном: текст обучают как предсказание следующего токена, а зрение — через flow matching, при этом Representation Autoencoder (RAE) подходит и для понимания, и для генерации. Авторы показывают, что MoE помогает справляться с асимметрией модальностей и что некоторые способности (включая элементы world modeling) могут появляться zero-shot за счёт общего мультимодального предобучения, что важно для проектирования «нативно» мультимодальных моделей.Источники: t.me/gonzo_ML
Исследование FlashAttention-4: оптимизация точного внимания под NVIDIA Blackwell
Вышла работа FlashAttention-4 с ко-дизайном алгоритма и kernel-пайплайна, заточенная под архитектуру NVIDIA Blackwell (B200/GB200), где узкими местами становятся не тензорные ядра, а «обычная» математика и экспоненты. Авторы заявляют производительность до 1613 TFLOPs/s, что важно для эффективного обучения и инференса моделей с длинным контекстом на новом поколении GPU.Источники: t.me/gonzo_ML
Cascadeur: локальная AI-интерполяция анимации между позами без подписок и кредитов
В последней версии Cascadeur ИИ интерактивно строит промежуточную анимацию между заданными позами, позволяя править ключевые и добавлять промежуточные точки. Подчёркивается, что генерация происходит локально и входит в стоимость лицензии, что важно для студий, которым критичны автономность и предсказуемые затраты.Источники: t.me/cgevent
ComfyUI App Builder: упаковка workflow в «приложение», но с ограничениями для локального использования
Описан опыт с ComfyUI App Builder: параметры нод можно превратить в поля ввода/слайдеры и получить App View, при этом на диске остаётся JSON с описанием параметров. Отмечено, что корректная работа, вероятно, завязана на Comfy Cloud, а локально остаётся проблема воспроизводимости из‑за отсутствующих нод/моделей и неочевидной установки зависимостей.Источники: t.me/cgevent
В Grok добавили поддержку до 7 референсов для консистентности в видео
Сообщается, что в Grok теперь можно использовать до 7 референсов, и они сохраняются в видео с нормальной консистентностью. Это важно для генерации роликов с устойчивыми персонажами/объектами и стилем между сценами.Источники: t.me/cgevent
В Photoshop Beta появилась AI-функция Rotate Object для поворота 2D-слоёв в 3D
В бете Photoshop добавили функцию Rotate Object, позволяющую «крутить» плоские 2D-изображения/слои в 3D-пространстве. Это расширяет возможности быстрой правки ракурса без ручного 3D-моделинга и может ускорить создание вариаций визуалов.Источники: t.me/ai_newz, t.me/denissexy, t.me/cgevent
Claude увеличил контекст до 1 млн токенов по умолчанию и убрал доплату за длинные запросы
Сообщается, что в Claude теперь по умолчанию доступен контекст в 1 миллион токенов, а повышенную цену за запросы сверх определённой длины убрали. Расширенный контекст доступен для Sonnet 4.6 и Opus 4.6 через API и в Claude Code по подпискам Max/Team/Enterprise, но не в обычном чате, что важно для задач с очень длинными документами и кодом.Источники: t.me/ai_newz