Игорь Градов

20 июня 2026 г. в 04:30 МСК5 мин

Nvidia показала, что такое ИИ-агент в робототехнике: роботы учатся ночью без людей

Система, в которой ИИ-агенты сами решают, как обучать роботов, перестала быть лабораторной фантазией: 16 июня 2026 года исследователи Nvidia, Университета Карнеги-Меллона и Калифорнийского университета в Беркли опубликовали описание фреймворка ENPIRE, и спор о том, нужен ли человек в цикле робототехнического обучения, стал предметным.

Для авторов и маркетологов, далёких от роботов, тема звучит отвлечённо, но вопрос «что такое ИИ-агент и где заканчиваются его полномочия» касается каждого, кто работает с автоматизацией контента, рассылок, аналитики: если агент может ночью переобучить робота, завтра он перепишет вашу воронку продаж без спроса.

Что сделали в Nvidia GEAR?

Лаборатория Nvidia GEAR (Generalist Embodied Agent Research) совместно с Университетом Карнеги-Меллона и Калифорнийским университетом в Беркли создала программную обвязку ENPIRE. Это агентный фреймворк (agentic harness), программная оболочка вокруг ИИ-моделей, которая даёт им доступ к инструментам, памяти, контексту, ограничениям и петлям обратной связи.

ENPIRE состоит из четырёх модулей. Они позволяют ИИ-агентам:

автоматически сбрасывать и верифицировать задачи,
уточнять политики (наборы правил), управляющие поведением робота,
оценивать эти политики на нескольких физических роботах параллельно,
анализировать логи ошибок, читать научные статьи и самостоятельно править код алгоритмов и инфраструктуры обучения.

Фреймворк тестировали с тремя кодовыми ИИ-агентами: Codex от OpenAI на базе GPT-5.5, Claude Code от Anthropic на базе Opus 4.7 и Kimi Code от Moonshot AI на базе Kimi K2.6. Команды агентов независимо друг от друга разрабатывали разные подходы к обучению роботов, проверяли их на реальном оборудовании и сохраняли только те изменения, которые повышали общий процент успешных операций.

Роботы в итоге научились перерезать стяжки и вставлять видеокарты в тонкие слоты на материнских платах. Человек при этом не участвовал в самом цикле обучения.

Почему это важно

Впервые опубликован работающий фреймворк, где ИИ-агенты полностью замыкают цикл обучения робота: ставят задачу, пишут код, тестируют на физическом железе, читают научные статьи при ошибках и правят алгоритм сами. Nvidia пообещала выложить ENPIRE в открытый доступ (опенсорс), а значит, порог входа для любой лаборатории резко падает.

Аргументы за автономное обучение роботов

Скорость без выходных. Джим Фан, директор по ИИ в Nvidia, написал в LinkedIn, что часть лаборатории GEAR теперь «непрерывно самосовершенствуется ночью», а утром команда просто читает отчёты. Человек из узкого места превращается в рецензента.

Открытый доступ снижает барьер. Фан заявил, что команда планирует открыть код, чтобы любой мог развернуть «самоуправляемую роботизированную лабораторию у себя дома». Для небольших лабораторий, в том числе российских, это шанс работать с передовой методологией без бюджета Nvidia.

Параллелизм агентов. Три разных кодовых агента от трёх компаний одновременно пробовали разные алгоритмические подходы и оставляли лучшие. Такой «эволюционный» отбор трудно воспроизвести силами одной человеческой команды за сопоставимое время.

Самодиагностика. Модуль анализа ошибок не просто перезапускает упавший эксперимент: агент читает логи, ищет релевантные научные статьи и правит инфраструктурный код. Для тех, кто привык к слову «что такое ИИ-агент» в контексте чат-ботов, это качественно другой уровень автономии.

Честные аргументы против

Непрозрачность решений. Когда агент сам выбирает алгоритм и сам же его оценивает, человеку сложно понять, почему конкретный подход был отвергнут. В безопасности промышленных роботов «чёрный ящик» между командой и результатом создаёт риски, которые пока никем не стандартизированы.

«Щедрый бюджет токенов». Авторы исследования прямо упоминают generous token budget, то есть обильный расход токенов (единиц текста, которые оплачиваются при каждом запросе к модели). Для Nvidia это внутренние ресурсы, для небольшой лаборатории ночной прогон трёх агентов может обойтись дороже, чем зарплата инженера.

Воспроизводимость на практике. Эксперименты проводились на оборудовании Nvidia с доступом к её вычислительным мощностям. Открытый код фреймворка не гарантирует, что результаты повторятся на другом железе с другими агентами. Пока нет независимых воспроизведений.

Регуляторная пустота. Ни в одной юрисдикции нет правил, которые описывают ответственность за действия робота, обученного агентом без участия человека. Если робот повредит оборудование или травмирует оператора, кто отвечает: разработчик фреймворка, владелец агента или оператор лаборатории?

Часть нашей лаборатории NVIDIA GEAR теперь непрерывно самосовершенствуется ночью. Утром мы просто читаем отчёты. : Джим Фан, директор по ИИ в Nvidia

Мнение редакции dzen.guru

ENPIRE показывает, куда движется понятие «что такое ИИ-агент»: от помощника, которому дают промпт и ждут текст, к системе, которая сама ставит гипотезу, экспериментирует и отбраковывает неудачи. Я считаю это одной из самых наглядных демонстраций агентности за последний год, именно потому, что результат физический: робот или вставил GPU в слот, или нет, тут нельзя «галлюцинировать» (уверенно выдумать результат, которого не было).

Оговорка: пока это работает внутри лаборатории Nvidia на её железе и её бюджете. Открытый код не равен открытому результату.

Что делать уже сейчас:

Автору на Дзене. Следите за терминами «агентный фреймворк» и «автономный цикл обучения»: через полгода-год они перекочуют из робототехники в маркетинговые платформы, и клиенты начнут спрашивать, «а ваш бот умеет сам себя улучшать?»
Маркетологу. Если вы уже используете ИИ-агентов для рассылок или аналитики, задайте вопрос поставщику: есть ли у агента петля обратной связи или он просто выполняет скрипт? Разница принципиальная.
Разработчику робототехники в России. ENPIRE обещают выложить в опенсорс. Когда код появится, протестируйте на доступных агентах. Из работающих в РФ аналогов кодовых ИИ-агентов пока ближе всего GigaCode от Сбера, но его агентные возможности пока заметно уже.

Что реально ждать дальше?

Nvidia обещала открыть код ENPIRE, но конкретной даты в публикации нет. Если это произойдёт, первыми фреймворк подхватят университетские лаборатории с доступом к роботизированным стендам, а вопрос стоимости токенов при автономных ночных прогонах станет практической задачей, а не теоретической. Для тех, кто работает с автоматизацией вне робототехники, главный вывод проще: агент, который сам себя улучшает в замкнутом цикле, уже существует в железе, а значит, появится и в вашем рабочем инструменте, и к этому стоит готовиться не после, а до.

По материалам Ars Technica AI

Поделиться:Telegram VK

Игорь Градов

Основатель dzen.guru. Эксперт по монетизации и продвижению на Дзен. Автор курса «Старт на Дзен 2026».

G7 потребовала гарантий: американский искусственный интеллект могут отключить любой стране за ночь

Мировые лидеры на саммите G7 17 июня потребовали гарантий, что Вашингтон не сможет в одностороннем порядке отключить их странам доступ к американскому…

20 июня в 05:45 МСК5 мин

Парадокс в истории развития искусственного интеллекта: 49% американцев пользуются ИИ, но лишь 16% ему доверяют

Согласно новому исследованию Pew Research, 49% американцев пользуются чат-ботами хотя бы иногда, но две трети считают, что технология развивается слишком…

20 июня в 05:30 МСК4 мин

Pramaana Labs привлекла $27 млн на формальную верификацию ИИ в праве и фармацевтике

Pramaana Labs, стартап из сферы надёжности нейросетей, 18 июня привлёк $27 млн посевных инвестиций, чтобы применить формальную верификацию ИИ к областям, где…

20 июня в 05:15 МСК4 мин