AI: дайджест за 18 июня 2026
1. Midjourney запускает медицинское подразделение и анонсирует полноростовой УЗИ-сканер тела
Midjourney объявила о выходе в медицину с продуктом Midjourney Scanner: кольцевой ультразвуковой сканер, который за ~60 секунд строит 3D-карту тела; заявляются кратно меньшая стоимость и существенно более высокая скорость по сравнению с МРТ. Компания планирует масштабирование до 50 тыс. устройств за 6 лет и пилотный запуск формата Midjourney Spa в Сан-Франциско к концу 2027, что может сделать регулярный скрининг доступнее и сместить фокус Midjourney за пределы генерации изображений.
Источники: t.me/denissexy, t.me/ai_newz, t.me/How2AI, t.me/cgevent
2. MiniMax представила Sparse Attention и открыла веса MiniMax-M3 (109B MoE)
В работе MiniMax Sparse Attention предложен разреженный блочный механизм внимания поверх GQA с отдельной индексной веткой для выбора KV-блоков и точным вычислением внимания по выбранным блокам. Заявлены ускорения на сверхдлинных контекстах до 1M токенов: до 28,4× меньше FLOPs на токен, а на NVIDIA H800 — 14,2× быстрее prefill и 7,6× быстрее декодирование; код и веса MiniMax-M3 выложены в открытый доступ.
Источники: t.me/gonzo_ML
3. Метод предобучения нелинейных RNN без BPTT через учителя-трансформера
В статье Pretraining Recurrent Networks without Recurrence предложены SMT и DMT: трансформер-учитель формирует целевые состояния памяти, после чего RNN обучается параллельно во времени предсказывать переходы памяти без разворачивания по времени и BPTT. Подход обещает стабильный градиентный путь O(1) при предобучении и сохраняет преимущества RNN на инференсе с постоянной памятью.
Источники: t.me/gonzo_ML
4. Suno улучшила разбиение трека на стэмы: добавлен Advanced split
Suno обновила stem separation: помимо Autosplit и Split from mix появился режим Advanced split, который пересобирает стэмы с «чистым» звуком на актуальной модели (V5.5) вместо частотной изоляции. Режим доступен в подписке Premiere, бета-гранулярные стэмы (kick/snare и т.п.) требуют доработки, а каждый стэм стоит 10 кредитов (по умолчанию генерируются 2 версии, максимум до 12 дорожек).
Источники: t.me/cgevent
5. DeepSeek добавил Vision: распознавание изображений в интерфейсе
В DeepSeek появилась функция распознавания изображений (кнопка «Распознавание изображений»), которая может выдавать описание даже без промпта. Это расширяет сценарии использования сервиса в сторону мультимодальности прямо в веб-интерфейсе.
Источники: t.me/cgevent
6. LTX обновила LTX Trainer и расширила возможности обучения LoRA/файнтюна для LTXV
LTX обновила LTX Trainer: заявлено 10+ режимов для обучения LoRA по видео и аудио (включая t2v/i2v, инпейтинг/аутпейтинг, audio-to-video, video-to-audio/Foley, text-to-audio и др.), опубликованы базовые LoRA на Hugging Face и документация по датасетам и оптимизации памяти. Отмечаются высокие требования к VRAM (рекомендация 80+ ГБ), но упоминаются INT8-кванты и распределённый файнтюн на кластере GPU, а также интеграция со «скиллом» для агентных инструментов.
Источники: t.me/cgevent
7. Seedance 2.0 Mini: более дешёвая и быстрая версия модели Dreamina
Вышла Dreamina Seedance 2.0 Mini: заявлено примерно на 30% дешевле базовой версии и в 2 раза быстрее режима Fast при обещанном качестве уровня Fast. API пока нет, но у провайдеров отмечены скидки на подписки и токены, что делает модель удобной для быстрого подбора промптов перед финальным рендером.
Источники: t.me/ai_newz
8. Cisco Cloud Control: единая консоль управления и площадка для AI-агентов
На Cisco Live показали Cisco Cloud Control как объединение множества сетевых контроллеров и интерфейсов в один экран, а также как место, где будут работать AI-агенты. По сообщению из видео, решение уже демонстрировалось как работающее «прямо сейчас», что указывает на переход от анонсов к внедрению агентных сценариев в управлении инфраструктурой.
Источники: youtube.com
9. HappyOyster открыл доступ без инвайтов и раздаёт ежедневные кредиты
Сервис happyoyster.com стал доступен без приглашений; при логине обещают выдавать по 1000 кредитов в день до 17 июля. Это снижает барьер входа для тестирования и сравнения стоимости режимов генерации внутри продукта.
Источники: t.me/cgevent
10. Noam Shazeer, по сообщениям, перешёл из Google в OpenAI
Сообщается, что Ноам Шазир перешёл из Google в OpenAI, что может усилить исследовательскую команду OpenAI и ослабить позиции Gemini. В посте также отмечено, что ранее Google возвращал Шазира через сделку вокруг Character AI, что подчёркивает значимость кадрового перехода.
Источники: t.me/ai_newz