NVIDIA научила роботов учиться без человека: платформа ENPIRE достигает 99% точности

Компания NVIDIA представила программную платформу ENPIRE, которая позволяет роботам самостоятельно учиться выполнять физические задачи без участия человека, достигая 99% точности на ряде операций с ручной манипуляцией.

Почему это важно

Впервые агентный цикл «попробовал, ошибся, разобрал ошибку, попробовал снова», знакомый по программным ИИ-агентам (программам, которые сами ставят себе подзадачи и выполняют их), перенесён на физических роботов с автоматической оценкой результата и автоматическим сбросом сцены, то есть без оператора между попытками.

Исследование опубликовано командой NVIDIA и описано в рассылке Import AI (выпуск 463). До сих пор обучение роботов в реальном мире требовало постоянного присутствия человека: кто-то должен был оценивать каждую попытку, а затем вручную возвращать объекты на место для следующей. ENPIRE заменяет обе эти роли программными модулями и превращает физическое обучение в замкнутый цикл, которым управляет ИИ-агент.

Показатель	Значение	Источник
Точность на задачах ручной манипуляции	99% (PushT, сортировка штырьков, разрезание стяжки)	Статья ENPIRE, NVIDIA
Число модулей платформы	4 (Environment, Policy Improvement, Rollout, Evolution)	Статья ENPIRE, NVIDIA
Аппаратная станция	Два манипулятора YAM (I2RT), набор камер, одна рабочая станция	Статья ENPIRE, NVIDIA
GPU на станции	NVIDIA RTX 5090	Статья ENPIRE, NVIDIA
Лучшие агенты-кодеры	GPT-5.5 (через Codex) и Opus 4.7 (через Claude Code), результаты сопоставимы	Статья ENPIRE, NVIDIA
Эффект масштаба агентов	8 агентов находят решение быстрее и иногда точнее, чем 1 агент	Статья ENPIRE, NVIDIA

Как устроен замкнутый цикл обучения?

ENPIRE состоит из четырёх модулей, каждый отвечает за свой шаг цикла.

Environment (EN) автоматически сбрасывает сцену в исходное состояние и проверяет, что всё готово к новой попытке. Раньше это делал лаборант руками.
Policy Improvement (PI) запускает улучшение стратегии поведения робота, то есть пересчитывает, как именно двигать манипуляторами.
Rollout (R) прогоняет новую стратегию на одном или нескольких роботах параллельно и собирает данные о результатах.
Evolution (E) передаёт логи ИИ-агенту-кодеру (coding agent), который читает записи, ищет публикации по теме и правит код обучения, чтобы устранить конкретные ошибки.

Весь контур работает без человека: робот пробует, система оценивает, сбрасывает сцену, агент-кодер анализирует провал, меняет код, и цикл повторяется.

Что обнаружили?

99% успешности на задачах точной манипуляции: толкание объекта по траектории (PushT), укладка штырьков в коробку, разрезание пластиковой стяжки кусачками. Дополнительный тест: установка GPU в материнскую плату.
GPT-5.5 и Opus 4.7 показали сопоставимые результаты в роли агентов-кодеров, модель Kimi-2.6 отстала. Выбор языковой модели влияет на скорость и качество, но не критичен, если модель достаточно сильная.
Масштабирование работает: 8 параллельных агентов находят высокооценённые решения раньше, чем один, а иногда выходят на абсолютный максимум, недоступный одиночному агенту. Причина: больше агентов покрывают больше вариантов стратегий.
Узкое место при масштабировании: когда агенты читают логи, пишут код или ждут ответа от языковой модели, роботы простаивают. Утилизация роботов (Machine Resource Utilization, MRU, доля времени, когда робот реально работает) падает с ростом числа машин, хотя загрузка GPU растёт. Параллелизация пока не линейная.

Как это читать

Результаты получены на относительно простых задачах с контролируемой средой: предметы фиксированной формы, ограниченное рабочее пространство, заранее определённые критерии успеха. Авторы прямо отмечают, что более сложные задачи, вероятно, потребуют участия человека и для оценки, и для сброса сцены. Сложность задач, которые ENPIRE способен атаковать, прямо ограничена возможностью автоматической оценки и автоматического сброса. Систему тестировали на оборудовании NVIDIA с GPU NVIDIA, то есть «нейтральной» проверки от стороннего бенчмарка пока нет.

Что это значит для вас?

Авторам Дзена и копирайтерам. Тема самообучающихся роботов набирает поисковый интерес. Запрос «самообучающийся робот купить» пока приводит к образовательным конструкторам и игрушкам, но ENPIRE показывает, куда движется индустрия: к системам, которые учатся сами и не требуют программиста на каждом шаге. Это хорошая тема для разбора, пока конкуренция в выдаче невысока.

Маркетологам и продуктовым командам. Если вы работаете с автоматизацией или продаёте оборудование, главный вывод: NVIDIA строит экосистему, где её GPU нужен не только для обучения моделей, но и для физической станции робота. RTX 5090 на каждой станции фиксирует аппаратную привязку.

Предпринимателям в РФ и СНГ. В России серийных аналогов ENPIRE нет. Ближайшие по духу проекты в робототехнике развивают «Сбер» (робот-курьер), «Яндекс» (роботы-доставщики «Ровер»), лаборатории МФТИ и Сколтеха. Подход NVIDIA может быть воспроизведён на открытом ПО и доступном оборудовании, но пока это уровень исследовательских лабораторий, а не готового продукта, который можно купить и внедрить.

Мнение редакции dzen.guru

ENPIRE интересен не столько конкретными задачами (толкание кубиков и укладка штырьков), сколько архитектурой: робот учится, а ИИ-агент правит его код обучения по логам ошибок. Это тот же цикл, который Codex и Claude Code выполняют с программами, только теперь результат измеряется не в пройденных тестах, а в физических движениях. По моим наблюдениям, именно замкнутый цикл «действие, оценка, правка кода» без человека станет стандартом в промышленной робототехнике через несколько лет. Но пока система работает только на задачах, где успех легко измерить автоматически. Как только задача становится неоднозначной (скажем, «аккуратно сложи вещи»), человек снова нужен. Так что до момента, когда можно будет найти «самообучающийся робот купить» для реального склада, путь ещё долгий.

Тем не менее ENPIRE фиксирует конкретный рубеж: физический робот впервые прошёл полный цикл самоулучшения без оператора и вышел на 99% точности, пусть и на ограниченных задачах. Для тех, кто следит за робототехникой или планирует автоматизацию, это сигнал начать разбираться в агентных архитектурах сейчас, пока технология ещё в лаборатории.

По данным Import AI, выпуск 463

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

OpenAI выпустила новую модель GPT-5.6 Sol: доступ контролирует Белый дом, а не рынок

OpenAI второго июня выпустила GPT-5.6 Sol, свою самую мощную на сегодня модель, но пока она доступна лишь примерно двадцати проверенным партнёрам по решению…

29 июня в 13:15 МСК4 мин

aggregator

GPT 5 от OpenAI доступен только 20 компаниям: правительство США впервые фильтрует релиз ИИ

GPT 5 от OpenAI объявлен 25 июня 2026 года, но доступ к нему ограничен узкой группой компаний, одобренных правительством США, что впервые превращает выпуск…

27 июня в 12:30 МСК6 мин

aggregator

OpenAI создала свой чип за 9 месяцев: зависимость от чипов Nvidia для ИИ начала слабеть

Я вижу противоречие: H1 задан как «OpenAI разрабатывает собственный чип ИИ», архетип указан how-to, но фактический материал источника — это новость о чипе…

26 июня в 07:45 МСК6 мин