AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами

Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в спорных случаях модель переключается на Opus 4.8, из‑за чего пользователи жалуются на отказы даже в безобидных задачах.

Источники: youtube.com, t.me/How2AI, t.me/ai_newz

2. Сбер открыл в open source диффузионную языковую модель GFusion и добавил поддержку в SGLang

Сбер выложил в открытый доступ экспериментальную диффузионную языковую модель GFusion на базе GigaChat и инструменты для более быстрого и менее ресурсоёмкого обучения диффузионных моделей. По заявлению команды, GFusion генерирует текст до 45% быстрее GigaChat 3 и получила поддержку в SGLang, что упрощает запуск и интеграцию.

Источники: t.me/official_gigachat

3. PTRM: стохастический поиск на инференсе улучшает Tiny Recursive Models для задач с ограничениями

В работе Probabilistic Tiny Recursive Model предложен фреймворк PTRM: в предобученные Tiny Recursive Models добавляют гауссовский шум на шагах рекурсии, порождая несколько траекторий, а лучшую выбирают существующей Q-head. Авторы утверждают, что компактные неавторегрессионные модели (5–7 млн параметров) могут превосходить сильные LLM на структурированных задачах (например, судоку) при существенно более дешёвом инференсе.

Источники: t.me/gonzo_ML

4. FRM: flow-модели с верификацией через неподвижные точки и FLOWDPO для самокоррекции

Flow Reasoning Models (FRM) предлагают решать задачи на удовлетворение ограничений с помощью дискретных flow-моделей и масштабировать качество на инференсе через итеративное самоулучшение. Ключевая идея — использовать стабильность неподвижных точек в динамике денойзинга как unsupervised-верификатор (заявлен AUROC близкий к 1.0) и подавлять самогенерируемые ошибки методом FLOWDPO, снижая вычисления относительно сильных бейзлайнов.

Источники: t.me/gonzo_ML

5. Autodata: агентный «дата-сайентист» для генерации качественной синтетики с эволюционной оптимизацией промптов

Autodata — фреймворк, где LLM-агенты в замкнутом цикле генерируют синтетические данные, оценивают их решателями, анализируют ошибки и автоматически улучшают инструкции; сверху добавлен эволюционный мета-цикл для оптимизации промптов агентов. Важность в том, что подход нацелен на повышение качества синтетических датасетов и обучение меньших моделей на сложных доменах, что, по описанию, может улучшать рассуждения и снижать «раздутость» цепочек.

Источники: t.me/gonzo_ML

6. Seedance 2.5: утечки о режимах Full/Mini/Fast, 4K, 30 секунд и возможном long-video до 180 секунд

Появились утечки по Seedance 2.5: заявлены режимы Full, Mini и Fast, поддержка 4K, до 30 секунд и до 50 референсов, а также упоминание beta long-video mode с расширением до 180 секунд. Дополнительно опубликованы страницы с черновыми описаниями и примерами, где видно, что в референсах могут смешиваться изображения и видео.

Источники: t.me/cgevent

7. Fal.ai запустили обучение 3D LoRA для TRELLIS.2 (геометрия/текстуры/структура)

Fal.ai представили тренер для 3D LoRA под TRELLIS.2: можно загрузить папку с 3D-моделями и получить набор LoRA (Geometry, Texture, Sparse Structure), которые затем подключаются на инференсе. Это важно как попытка кастомизировать 3D-генерацию под более качественные меши и собственные ассеты, а не полагаться на среднее качество датасетов базовых 3D-генераторов.

Источники: t.me/cgevent

8. Reuters: Маск опроверг сообщение о прототипе AI-смартфона от SpaceX/xAI, показанном инвесторам

По Reuters, WSJ сообщила, что SpaceX якобы показывала инвесторам прототип AI-девайса, похожего на смартфон (тоньше iPhone, Snapdragon, своя ОС, xAI/Grok), но Илон Маск назвал этот репорт «utterly false». Новость важна тем, что иллюстрирует ожидания рынка вокруг «железного» интерфейса к ИИ и конкурирующих нарративов о том, кто первым выведет AI-устройство за пределы приложений.

Источники: t.me/cgevent

Read more

AI: дайджест за 3 июля 2026

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы

By Kirill Brusenskiy
AI: дайджест за 2 июля 2026

AI: дайджест за 2 июля 2026

1. Сбер открыл в open source диффузионную языковую модель GFusion и интегрировал её в SGLang Сбер выложил экспериментальную диффузионную LLM GFusion (на базе GigaChat) и сопутствующие инструменты обучения, заявив ускорение генерации текста до 45% относительно GigaChat 3. Важно тем, что это публичный опенсорс-эксперимент с альтернативной (не автогрессивной) схемой генерации и

By Kirill Brusenskiy
AI: дайджест за 1 июля 2026

AI: дайджест за 1 июля 2026

1. Anthropic выпустила Claude Sonnet 5 и сделала его моделью по умолчанию Anthropic представила Claude Sonnet 5: по заявлению компании, он ближе по качеству к Opus 4.8, чем к Sonnet 4.6, и доступен всем пользователям, включая бесплатных. Введена промо-цена до 31 августа ($2/$10 за 1M токенов input/

By Kirill Brusenskiy
AI: дайджест за 30 июня 2026

AI: дайджест за 30 июня 2026

1. ComfyUI запустил бету MCP-сервера, CLI и Comfy Skill для агентного управления воркфлоу ComfyUI начал бетатест MCP-сервера, который позволяет ИИ-агентам управлять генеративными воркфлоу: запускать схемы по описанию на естественном языке, искать ноды/модели, подхватывать воркфлоу по URL и переиспользовать сохранённые пайплайны. Параллельно запущены бета Comfy CLI и репозиторий Comfy Skill,

By Kirill Brusenskiy