AI: дайджест за 18 июня 2026

AI: дайджест за 18 июня 2026

1. Midjourney запускает медицинское подразделение и анонсирует полноростовой УЗИ-сканер тела

Midjourney объявила о выходе в медицину с продуктом Midjourney Scanner: кольцевой ультразвуковой сканер, который за ~60 секунд строит 3D-карту тела; заявляются кратно меньшая стоимость и существенно более высокая скорость по сравнению с МРТ. Компания планирует масштабирование до 50 тыс. устройств за 6 лет и пилотный запуск формата Midjourney Spa в Сан-Франциско к концу 2027, что может сделать регулярный скрининг доступнее и сместить фокус Midjourney за пределы генерации изображений.

Источники: t.me/denissexy, t.me/ai_newz, t.me/How2AI, t.me/cgevent

2. MiniMax представила Sparse Attention и открыла веса MiniMax-M3 (109B MoE)

В работе MiniMax Sparse Attention предложен разреженный блочный механизм внимания поверх GQA с отдельной индексной веткой для выбора KV-блоков и точным вычислением внимания по выбранным блокам. Заявлены ускорения на сверхдлинных контекстах до 1M токенов: до 28,4× меньше FLOPs на токен, а на NVIDIA H800 — 14,2× быстрее prefill и 7,6× быстрее декодирование; код и веса MiniMax-M3 выложены в открытый доступ.

Источники: t.me/gonzo_ML

3. Метод предобучения нелинейных RNN без BPTT через учителя-трансформера

В статье Pretraining Recurrent Networks without Recurrence предложены SMT и DMT: трансформер-учитель формирует целевые состояния памяти, после чего RNN обучается параллельно во времени предсказывать переходы памяти без разворачивания по времени и BPTT. Подход обещает стабильный градиентный путь O(1) при предобучении и сохраняет преимущества RNN на инференсе с постоянной памятью.

Источники: t.me/gonzo_ML

4. Suno улучшила разбиение трека на стэмы: добавлен Advanced split

Suno обновила stem separation: помимо Autosplit и Split from mix появился режим Advanced split, который пересобирает стэмы с «чистым» звуком на актуальной модели (V5.5) вместо частотной изоляции. Режим доступен в подписке Premiere, бета-гранулярные стэмы (kick/snare и т.п.) требуют доработки, а каждый стэм стоит 10 кредитов (по умолчанию генерируются 2 версии, максимум до 12 дорожек).

Источники: t.me/cgevent

5. DeepSeek добавил Vision: распознавание изображений в интерфейсе

В DeepSeek появилась функция распознавания изображений (кнопка «Распознавание изображений»), которая может выдавать описание даже без промпта. Это расширяет сценарии использования сервиса в сторону мультимодальности прямо в веб-интерфейсе.

Источники: t.me/cgevent

6. LTX обновила LTX Trainer и расширила возможности обучения LoRA/файнтюна для LTXV

LTX обновила LTX Trainer: заявлено 10+ режимов для обучения LoRA по видео и аудио (включая t2v/i2v, инпейтинг/аутпейтинг, audio-to-video, video-to-audio/Foley, text-to-audio и др.), опубликованы базовые LoRA на Hugging Face и документация по датасетам и оптимизации памяти. Отмечаются высокие требования к VRAM (рекомендация 80+ ГБ), но упоминаются INT8-кванты и распределённый файнтюн на кластере GPU, а также интеграция со «скиллом» для агентных инструментов.

Источники: t.me/cgevent

7. Seedance 2.0 Mini: более дешёвая и быстрая версия модели Dreamina

Вышла Dreamina Seedance 2.0 Mini: заявлено примерно на 30% дешевле базовой версии и в 2 раза быстрее режима Fast при обещанном качестве уровня Fast. API пока нет, но у провайдеров отмечены скидки на подписки и токены, что делает модель удобной для быстрого подбора промптов перед финальным рендером.

Источники: t.me/ai_newz

8. Cisco Cloud Control: единая консоль управления и площадка для AI-агентов

На Cisco Live показали Cisco Cloud Control как объединение множества сетевых контроллеров и интерфейсов в один экран, а также как место, где будут работать AI-агенты. По сообщению из видео, решение уже демонстрировалось как работающее «прямо сейчас», что указывает на переход от анонсов к внедрению агентных сценариев в управлении инфраструктурой.

Источники: youtube.com

9. HappyOyster открыл доступ без инвайтов и раздаёт ежедневные кредиты

Сервис happyoyster.com стал доступен без приглашений; при логине обещают выдавать по 1000 кредитов в день до 17 июля. Это снижает барьер входа для тестирования и сравнения стоимости режимов генерации внутри продукта.

Источники: t.me/cgevent

10. Noam Shazeer, по сообщениям, перешёл из Google в OpenAI

Сообщается, что Ноам Шазир перешёл из Google в OpenAI, что может усилить исследовательскую команду OpenAI и ослабить позиции Gemini. В посте также отмечено, что ранее Google возвращал Шазира через сделку вокруг Character AI, что подчёркивает значимость кадрового перехода.

Источники: t.me/ai_newz

Read more

AI: дайджест за 4 июля 2026

AI: дайджест за 4 июля 2026

1. DeepSeek представила DSpark для ускорения спекулятивного декодирования Команда DeepSeek-AI описала фреймворк DSpark: полуавторегрессионный параллельный «драфтер» и шедулер префиксов на основе уверенности, чтобы ускорять инференс LLM под высокой конкурентной нагрузкой. Заявлено ускорение генерации на 60–85% для DeepSeek-V4 при сохранении пропускной способности и без деградации качества в «хвосте» последовательности; код

By Kirill Brusenskiy
AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в

By Kirill Brusenskiy
AI: дайджест за 3 июля 2026

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы

By Kirill Brusenskiy
AI: дайджест за 2 июля 2026

AI: дайджест за 2 июля 2026

1. Сбер открыл в open source диффузионную языковую модель GFusion и интегрировал её в SGLang Сбер выложил экспериментальную диффузионную LLM GFusion (на базе GigaChat) и сопутствующие инструменты обучения, заявив ускорение генерации текста до 45% относительно GigaChat 3. Важно тем, что это публичный опенсорс-эксперимент с альтернативной (не автогрессивной) схемой генерации и

By Kirill Brusenskiy