AI: дайджест за 26 марта 2026
Runway Multi-Shot App: автоматические мультиракурсы и нарезка сцен по коротким промптам
Runway показала Multi-Shot App, где модель сама выбирает ракурсы, планы и точки склейки, позволяя получать мультикамерные ролики без сложной разметки «камера 1/2/3» и с короткими промптами. Это упрощает производство видео, но поднимает вопрос о снижении мотивации учиться монтажу у начинающих.Источники: t.me/cgevent
Исследование: «экспертные персоны» улучшают alignment, но могут снижать точность
Исследование USC о промптах-персонах показывает, что «экспертные» роли чаще улучшают стиль, соблюдение формата и безопасность/отказы, но ухудшают фактическую точность и некоторые задачи рассуждения/кода; длинные описания персон усиливают эффект (как положительный, так и отрицательный). Практический вывод: использовать персоны для редакторских и compliance-задач, но осторожнее — для фактов, математики и точного программирования.Источники: t.me/cgevent
Google Lyria 3 Pro: генерация музыки до 3 минут и доступ по подписке/API
Google обновила музыкальную модель Lyria 3 Pro: теперь она генерирует треки длительностью до 3 минут вместо 30 секунд. Доступ заявлен через подписку (в т.ч. в Gemini), а также через AI Studio и API с указанной ценой $0.08 за трек, что делает возможной end-to-end генерацию полноценных композиций.Источники: t.me/cgevent, t.me/ai_newz
Датасет 3D-голов: 7547 сканов с 11 выражениями и унифицированной топологией
Создан крупный набор 3D-сканов голов: 7547 человек, каждый с 11 выражениями лица; данные отретоплены в две согласованные топологии (200K и 7M полигонов), что позволяет морфинг между людьми и эмоциями. Потенциально полезно для синтетических лиц, обучения моделей и задач распознавания эмоций, но доступ требует лицензирования у авторов.Источники: t.me/cgevent
ComfyUI: Dynamic VRAM снижает требования к памяти
В ComfyUI добавили оптимизацию Dynamic VRAM, меняющую способ обработки весов моделей и уменьшающую требования к VRAM/RAM, что должно улучшить плавность работы на видеокартах с ограниченной памятью. Обновление нацелено на более стабильную локальную генерацию без упора в память.Источники: t.me/cgevent
HyperAgents (FAIR и соавт.): саморедактируемые гиперагенты для open-ended самоулучшения
Опубликован фреймворк DGM-Hyperagents, где агент для решения задач и метаоптимизирующий агент объединены в единую самореферентную программу, способную переписывать как логику решения, так и собственные механизмы улучшения в ходе open-ended эволюционного поиска. Важность в том, что система может автономно изобретать переносимые методы оптимизации (например, постоянную память и выявление смещений), а не опираться на вручную заданные мета-эвристики.Источники: t.me/gonzo_ML
Claude Code получил Auto Mode с двухслойной защитой
В Claude Code появился auto mode: рутинные низкорисковые действия выполняются без подтверждений, а потенциально опасные — дополнительно проверяются. Anthropic добавила два слоя защиты (probe против prompt injection и отдельный classifier для поиска рискованных паттернов), но отмечает, что для high-stakes задач человек в контуре всё равно нужен.Источники: t.me/How2AI
Google Vibe Coding XR: прототипирование XR-приложений с Gemini и XR Blocks за ~60 секунд
Google представила подход Vibe Coding XR: связка Gemini и open-source фреймворка XR Blocks позволяет по текстовому/голосовому описанию быстро собирать рабочие прототипы XR-приложений (для Android XR или в браузерном симуляторе) примерно за минуту. Это снижает порог входа в разработку пространственных интерфейсов и ускоряет создание образовательных XR-сценариев.Источники: t.me/cgevent