Nvidia 打造了使用 AI 编码代理进行自我训练的机器人

原文：Nvidia Built Robots That Train Themselves Using AI Coding Agents

将 Decrypt 添加为您的首选来源，以便在 Google 上查看我们的更多故事。

简而言之，Nvidia、卡内基梅隆大学和加州大学伯克利分校发布了 ENPIRE，这是一个框架，可以让人工智能编码代理在没有人类监督的情况下运行教授机器人新技能的完整循环。

运行 Codex、Claude Code 和 Kimi Code 的代理推动由八个机器人组成的车队在执行别针插入、GPU 插入和拉链领带切割等任务时取得了 99% 的成功率。

从一个机器人扩展到八个机器人可以将完成一项任务所需的时间减少一半以上，尽管代币账单的增长速度甚至比节省的时间还要快。

Nvidia GEAR 实验室的八个机器人手臂在过去几周里自学如何插入别针、安装显卡和剪扎带。唯一参与其中的人是后来写这篇论文的人。

这项技能来自 ENPIRE，Nvidia、卡内基梅隆大学和加州大学伯克利分校的研究人员在周二发表的一篇论文中详细介绍了该框架。 ENPIRE 将训练机器人的全部工作交给人工智能编码代理，该软件已经编写和测试了自己的代码，并让它们直接在物理硬件上运行该过程。

像 OpenAI 的 Codex、Anthropic 的 Claude Code 和 Moonshot 的 Kimi Code 这样的编码代理在过去的一年里一直在进行研究人员所谓的自动研究——编写代码、测试代码，然后在没有人参与的情况下再次重写代码。该循环大部分停留在屏幕上，重置失败的实验不需要任何费用。 ENPIRE 将其拖入物理世界，重置实验意味着移动实际的机器人手臂。

建设“Enpire”

该系统将工作分为两个阶段。首先，人类引导智能体构建两个永久性工具：一个重置例程，将工作空间返回到一个新的起始位置；以及一个奖励功能，通过观看摄像机镜头来获得成功——基本上是一个从不眨眼、从不午休的裁判。该设置发生一次，然后在随后的每次尝试中重复使用。

阅读原文 →