AI: дайджест за 27 июня 2026 - 4 июля 2026
1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами
Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в спорных случаях модель переключается на Opus 4.8, из‑за чего пользователи жалуются на отказы даже в безобидных задачах.
Источники: youtube.com, t.me/How2AI, t.me/ai_newz
2. Сбер открыл в open source диффузионную языковую модель GFusion и добавил поддержку в SGLang
Сбер выложил в открытый доступ экспериментальную диффузионную языковую модель GFusion на базе GigaChat и инструменты для более быстрого и менее ресурсоёмкого обучения диффузионных моделей. По заявлению команды, GFusion генерирует текст до 45% быстрее GigaChat 3 и получила поддержку в SGLang, что упрощает запуск и интеграцию.
Источники: t.me/official_gigachat
3. PTRM: стохастический поиск на инференсе улучшает Tiny Recursive Models для задач с ограничениями
В работе Probabilistic Tiny Recursive Model предложен фреймворк PTRM: в предобученные Tiny Recursive Models добавляют гауссовский шум на шагах рекурсии, порождая несколько траекторий, а лучшую выбирают существующей Q-head. Авторы утверждают, что компактные неавторегрессионные модели (5–7 млн параметров) могут превосходить сильные LLM на структурированных задачах (например, судоку) при существенно более дешёвом инференсе.
Источники: t.me/gonzo_ML
4. FRM: flow-модели с верификацией через неподвижные точки и FLOWDPO для самокоррекции
Flow Reasoning Models (FRM) предлагают решать задачи на удовлетворение ограничений с помощью дискретных flow-моделей и масштабировать качество на инференсе через итеративное самоулучшение. Ключевая идея — использовать стабильность неподвижных точек в динамике денойзинга как unsupervised-верификатор (заявлен AUROC близкий к 1.0) и подавлять самогенерируемые ошибки методом FLOWDPO, снижая вычисления относительно сильных бейзлайнов.
Источники: t.me/gonzo_ML
5. Autodata: агентный «дата-сайентист» для генерации качественной синтетики с эволюционной оптимизацией промптов
Autodata — фреймворк, где LLM-агенты в замкнутом цикле генерируют синтетические данные, оценивают их решателями, анализируют ошибки и автоматически улучшают инструкции; сверху добавлен эволюционный мета-цикл для оптимизации промптов агентов. Важность в том, что подход нацелен на повышение качества синтетических датасетов и обучение меньших моделей на сложных доменах, что, по описанию, может улучшать рассуждения и снижать «раздутость» цепочек.
Источники: t.me/gonzo_ML
6. Seedance 2.5: утечки о режимах Full/Mini/Fast, 4K, 30 секунд и возможном long-video до 180 секунд
Появились утечки по Seedance 2.5: заявлены режимы Full, Mini и Fast, поддержка 4K, до 30 секунд и до 50 референсов, а также упоминание beta long-video mode с расширением до 180 секунд. Дополнительно опубликованы страницы с черновыми описаниями и примерами, где видно, что в референсах могут смешиваться изображения и видео.
Источники: t.me/cgevent
7. Fal.ai запустили обучение 3D LoRA для TRELLIS.2 (геометрия/текстуры/структура)
Fal.ai представили тренер для 3D LoRA под TRELLIS.2: можно загрузить папку с 3D-моделями и получить набор LoRA (Geometry, Texture, Sparse Structure), которые затем подключаются на инференсе. Это важно как попытка кастомизировать 3D-генерацию под более качественные меши и собственные ассеты, а не полагаться на среднее качество датасетов базовых 3D-генераторов.
Источники: t.me/cgevent
8. Reuters: Маск опроверг сообщение о прототипе AI-смартфона от SpaceX/xAI, показанном инвесторам
По Reuters, WSJ сообщила, что SpaceX якобы показывала инвесторам прототип AI-девайса, похожего на смартфон (тоньше iPhone, Snapdragon, своя ОС, xAI/Grok), но Илон Маск назвал этот репорт «utterly false». Новость важна тем, что иллюстрирует ожидания рынка вокруг «железного» интерфейса к ИИ и конкурирующих нарративов о том, кто первым выведет AI-устройство за пределы приложений.
Источники: t.me/cgevent