Новая архитектура LLM-JEPA

Kirill Brusenskiy

04 Mar 2026

Исследователи представили инновационный подход к обучению языковых моделей.

- Авторы LLM-JEPA разработали новый лосс для языковых моделей.

- Предложенный лосс обеспечивает качество репрезентаций, сопоставимое с джепами.

- Новый подход не требует сложных архитектур и алгоритмов.

- Эффективность достигается при меньших вычислительных затратах.

- Модель может быть до 16 раз более производительной по сравнению с традиционными методами.

Узнайте больше о LLM-JEPA [здесь](https://t.me/gonzo_ML/4873).

AI: дайджест за 5 июля 2026

1. HOLA: «гиппокамп» для линейного внимания с точной эпизодической памятью В работе «A Hippocampus for Linear Attention» предложена архитектура Hippocampal Linear Attention (HOLA): к рекуррентной state-space основе добавляется небольшой точный KV-кэш, который сохраняет наиболее «удивительные» токены по метрике из остатка дельта-правила. Это снижает перплексию на Wikitext-103 на 16,1% и

AI: дайджест за 4 июля 2026

1. DeepSeek представила DSpark для ускорения спекулятивного декодирования Команда DeepSeek-AI описала фреймворк DSpark: полуавторегрессионный параллельный «драфтер» и шедулер префиксов на основе уверенности, чтобы ускорять инференс LLM под высокой конкурентной нагрузкой. Заявлено ускорение генерации на 60–85% для DeepSeek-V4 при сохранении пропускной способности и без деградации качества в «хвосте» последовательности; код

AI: дайджест за 27 июня 2026 - 4 июля 2026

1. Anthropic временно вернули Fable 5 в подписку с лимитами и усиленными гардрейлами Fable 5 снова доступна в подписке Anthropic: с 1 по 7 июля её можно использовать бесплатно до 50% недельного лимита без активации, после 8 июля — только через API за доплату. Сообщается, что Anthropic усилили ограничения и в

AI: дайджест за 3 июля 2026

1. Утечки о Seedance 2.5: режимы, 4K и long-video до 180 секунд Появились утечки о Seedance 2.5: релиз ожидают примерно через две недели, заявлены варианты Full/Mini/Fast, генерация до 30 секунд и 4K, а также упоминание beta long-video mode с возможностью расширения до 180 секунд. Также опубликованы

Read more

AI: дайджест за 5 июля 2026

AI: дайджест за 4 июля 2026

AI: дайджест за 27 июня 2026 - 4 июля 2026

AI: дайджест за 3 июля 2026