Витрина 1 (Page 5)

AI: дайджест за 23 мая 2026

1. AutoTTS: агентный поиск стратегий test-time scaling для LLM В работе AutoTTS предложен фреймворк, где LLM-агент автоматически синтезирует контроллеры распределения вычислений на инференсе (ветвление, пробинг, прунинг, остановка) вместо ручных эвристик. Сообщается, что найденная стратегия снижает расход токенов почти на 70% относительно self-consistency при сохранении качества, а стоимость автоматического поиска составила

AI: дайджест за 16-23 мая 2026

1. AutoTTS: агентный автопоиск стратегий test-time scaling для LLM Представлен фреймворк AutoTTS, где LLM-агент автоматически синтезирует контроллеры, управляющие ветвлением/прунингом/остановкой на инференсе вместо ручных эвристик. Сообщается о снижении расхода токенов почти на 70% относительно self-consistency при сохранении качества и о низкой стоимости автоматического поиска (менее $40), что делает TTS

AI: дайджест за 22 мая 2026

1. Cerebras запустила Kimi K2.6 на 1000 токенов/с и сообщается об IPO Сообщается, что Cerebras запустила модель Kimi K2.6 (триллион параметров) со скоростью около 1000 токенов в секунду — заявляется как первый такой запуск для модели этого масштаба, но доступ пока только для enterprise-клиентов. В том же сообщении

AI: дайджест за 21 мая 2026

1. Apple выпустила ML-LiTO: генерация 3D-объекта по одной картинке с кодом и весами Apple представила собственный 3D-генератор, который восстанавливает форму объекта по одному изображению, используя информацию об освещении с разных ракурсов для повышения точности. Важно тем, что это воспроизводимый релиз с открытыми кодом и весами, пригодный для тестов и сравнения

AI: дайджест за 20 мая 2026

1. Google выпустил Gemini 3.5 Flash и сделал ставку на агентность На Google I/O представили Gemini 3.5 Flash: модель стала заметно сильнее в агентских задачах, получила высокую скорость генерации и новые бенчмарки, но при этом подорожала относительно прошлой Flash. Вокруг релиза также заявлены планы на Pro-версию в

AI: дайджест за 19 мая 2026

1. Сбер разрабатывает AI-native ERP и планирует вывод на рынок в 2027 году Сбер сообщил о разработке собственной ERP-платформы на микросервисах с ИИ-помощником ГигаЧат и цифровыми ИИ-агентами; первые массовые операции внутри банка планируются в январе 2027 года, а затем продукт хотят вывести на рынок. Это заметный шаг к замене SAP-класса

AI: дайджест за 18 мая 2026

1. Tencent открыла код и веса генератора миров HY-World-2.0 Tencent выложила в открытый доступ код и веса HY-World-2.0 — генератора 3D-сцен/«миров», который позиционируют как опенсорсный аналог Marble. Это важно как усиление доступности инструментов для генерации 3D-окружений и экспериментов с world/scene generation без закрытых платформ. Источники: t.me/

AI: дайджест за 17 мая 2026

1. Red Hat AI сравнила TurboQuant с FP8/BF16 в vLLM: компрессия есть, но часто ценой скорости Команда Red Hat AI провела систематическое исследование TurboQuant в интеграции с vLLM на ряде задач (включая reasoning и long-context retrieval) и сравнила режимы bf16, fp8 и несколько вариантов TurboQuant. По результатам, FP8 сохраняет

AI: дайджест за 16 мая 2026

1. vLLM протестировали TurboQuant для квантизации KV-кэша: экономия памяти vs сильное падение throughput В блоге vLLM сравнили варианты TurboQuant на разных архитектурах и бенчмарках: k8v4 и 4bit-nc почти не теряют качество и уменьшают KV-кэш на 15–35% относительно fp8, но 3-битные режимы заметно проседают, особенно на длинном контексте. При этом

AI: дайджест за 9-16 мая 2026

1. OpenAI добавила управление Codex из мобильного ChatGPT Codex теперь можно запускать и контролировать из мобильного приложения ChatGPT, управляя процессом на ноутбуке или удалённой машине (терминал, тесты, diff) и не давая компьютеру уснуть во время работы агента. Это упрощает использование «долгоиграющих» кодинг-агентов и делает их более практичными в повседневной разработке.

AI: дайджест за 15 мая 2026

1. Норникель запустил «ИИ-архитектора» для проектирования заводов и выпуска BIM-документации Компания сообщила о запуске отраслевой системы на базе генеративного ИИ: цифровые агенты анализируют ТЗ, генерируют разделы проектной документации, наполняют BIM-модель и сверяют решения с нормативами. Заявленный эффект — сокращение сроков подготовки документации вдвое и снижение текстовых ошибок, с оценкой экономического эффекта

AI: дайджест за 14 мая 2026

1. Anthropic вводит отдельный месячный кредит на programmatic/AFK-использование Claude в подписках С 15 июня в платных планах Claude появится отдельный месячный кредитный лимит для programmatic usage (claude -p, Agent SDK, GitHub Actions и другие AFK-сценарии), отделяя фоновые/автоматизированные запуски от обычной работы в чате. Это меняет экономику использования Claude

Latest