Витрина 1 (Page 3)

AI: дайджест за 14 июня 2026

1. Новый метод DPG для генерации синтетических датасетов под любую дифференцируемую цель В работе «Synthetic Data for any Differentiable Target» представлен Dataset Policy Gradient (DPG): RL-подход, который оптимизирует генератор синтетических данных на уровне отдельных примеров, используя многошаговые метаградиенты как сигнал награды. Это важно, потому что метод позволяет целенаправленно менять поведение

AI: дайджест за 13 июня 2026

1. Anthropic отключила доступ к Fable 5 и Mythos 5 из‑за требований экспортного контроля США Сообщается, что правительство США потребовало закрыть доступ к моделям Fable 5 и Mythos 5 для не-граждан (включая иностранных сотрудников Anthropic); из-за отсутствия быстрой проверки гражданства Anthropic временно отключила доступ всем. Поводом называют «частичный джейлбрейк»

AI: дайджест за 6-13 июня 2026

1. США ограничили доступ к моделям Anthropic Fable 5 и Mythos 5 по экспортному контролю Правительство США потребовало от Anthropic закрыть доступ к Fable 5 и Mythos 5 для иностранных граждан из‑за заявленного «джейлбрейка» с потенциальным применением в киберзадачах; Anthropic утверждает, что кейс узкий и похожие возможности есть у

AI: дайджест за 12 июня 2026

1. MiniMax выпустила открытую модель M3 с новым вариантом sparse attention Сообщается об открытом релизе MiniMax M3: 428B параметров при 23B активных и новый механизм MiniMax Sparse Attention (MSA), который заявлен как более эффективный, чем GQA, на больших контекстах. Важно как очередной шаг в оптимизации длинного контекста через разреженное внимание

AI: дайджест за 11 июня 2026

1. Google выпустила DiffusionGemma: диффузионную LLM на базе Gemma 4 Google представила DiffusionGemma (26B параметров, 4B активных) — текстовую диффузионную модель, генерирующую блоками по 256 токенов с многократным «уточнением» результата. Заявлена скорость свыше 1000 ток/с на одной H100 (FP8) и около 700 ток/с на RTX 5090 при некотором падении

AI: дайджест за 10 июня 2026

1. Anthropic выпустила Claude Fable 5 и Claude Mythos 5: доступ, цена и позиционирование Anthropic анонсировала Claude Fable 5 (публичная версия) и Claude Mythos 5 (почти та же базовая модель с ослабленными ограничителями, доступная ограниченному кругу). В API заявлена цена $10 за 1M входных и $50 за 1M выходных токенов;

AI: дайджест за 9 июня 2026

1. В ГигаЧате появилось детальное редактирование фото по выделенной области В ГигаЧате добавили режим, где пользователь кистью выделяет область на фото и задаёт промпт: изменяется только выделенное, остальное сохраняется. Это упрощает точечные правки (удаление/добавление объектов) без сложных текстовых описаний масок. Источники: t.me/official_gigachat 2. ГигаЧат научился редактировать

AI: дайджест за 8 июня 2026

1. UBTECH Robotics тизерит гуманоидов U1 для массового рынка UBTECH Robotics показала тизеры человекоподобных роботов серии U1: две модели (183 см/42 кг и 168 см/35,2 кг) с 88 степенями свободы, Wi‑Fi, встроенным ИИ и автономностью до 4 часов. Полную презентацию компания запланировала на 30 июня, что

AI: дайджест за 7 июня 2026

1. Исследование: как масштабировать PEFT/LoRA до миллионов персональных адаптеров для гигантских моделей Mind Lab опубликовали работу о превращении PEFT в инфраструктуру персонализации: методы стабилизации сверхкомпактных адаптеров при RL-обучении и система кеширования миллионов адаптеров на одной базовой модели триллионного масштаба. Важно тем, что это предлагает практический путь к массовой персонализации

AI: дайджест за 6 июня 2026

1. Microsoft раскрыла детали обучения MAI-Thinking-1 (MoE LLM с reasoning) Microsoft опубликовала подробный техрепорт о тренировке MAI-Thinking-1 — MoE-модели с 35B active / 1T total параметров и контекстом 256k токенов, обученной на кластере из 8000 GB200. Важность в том, что Big Tech редко делится таким уровнем инженерных деталей; модель не обещают открыть

AI: дайджест за 30 мая 2026 - 6 июня 2026

1. q0: фреймворк для сверхмногоэпохового предобучения при дефиците данных Предложен q0 — подход к предобучению, который вместо «полировки» одной модели после насыщения использует параллельные циклические расписания, пул разнообразных моделей и последовательную дистилляцию. Авторы заявляют рост эффективности использования данных до 12,9× и улучшения на бенчмарках до 16×, что важно на фоне

AI: дайджест за 5 июня 2026

1. Google выпустила Magenta RealTime 2 для офлайн-генерации музыки на Mac с Apple Silicon Google представила Magenta RealTime 2 — низколатентную музыкальную модель/инструмент, работающий локально и без интернета, но только на Mac с Apple Silicon. В комплекте заявлены открытые веса и набор инструментов/скриптов для задач вроде клонирования звуков, смешивания

Latest