Nvidia, CMU и UC Berkeley показали ENPIRE: ИИ-агенты сами дорабатывают код управления роботами

Исследователи Nvidia, Университета Карнеги — Меллона и Калифорнийского университета в Беркли представили ENPIRE — фреймворк, в котором ИИ-агенты для программирования улучшают политики управления роботами на реальном оборудовании. В демонстрациях система достигала до 99% успешности на сложных задачах манипуляции, но авторы отмечают рост вычислительных затрат и неполное использование роботов при масштабировании.

Исследователи Nvidia, Университета Карнеги — Меллона и Калифорнийского университета в Беркли представили ENPIRE — фреймворк для автономного улучшения роботических политик с помощью ИИ-агентов, которые пишут и меняют код обучения.

ENPIRE строит замкнутый цикл на физическом оборудовании: робот автоматически возвращает сцену в исходное состояние, выполняет попытку, система проверяет результат, после чего агент анализирует логи, формулирует гипотезы и вносит изменения в код. Для улучшения политики агенты могут использовать разные подходы, включая эвристики, imitation learning, offline- и online-RL.

Авторы показывают работу системы на задачах ловкой манипуляции: Push-T, укладка штифтов в коробку, работа с кабельными стяжками и установка GPU в материнскую плату. По данным проекта, ENPIRE достигал до 99% успешности на ряде реальных задач.

Отдельный акцент сделан на масштабировании: эксперименты запускались на парке из восьми роботизированных станций, где разные агенты параллельно проверяли гипотезы и переиспользовали удачные изменения. Исследователи также сравнили несколько coding agents, включая Codex с GPT-5.5, Claude Code с Opus 4.7 и Kimi Code с Kimi K2.6.

Ограничения остаются существенными. Авторы указывают, что роботы и вычислительные ресурсы простаивают, пока агенты читают логи, пишут код или ждут ответа языковой модели, а при увеличении числа роботов растет расход токенов. Поэтому ENPIRE пока выглядит не как готовая промышленная система, а как исследовательский шаг к роботам, которые способны улучшать свои навыки в реальном мире с меньшим участием человека.

Источник: research.nvidia.com

Связь с редакцией