英伟达推出通用AI智能体 NitroGen：由4万小时游戏视频“养成”的全能玩家-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

英伟达（NVIDIA）近日展示其在通用人工智能（AGI）方向的最新进展，发布了一款名为NitroGen的游戏智能体基础模型。不同于只面向单一任务的 AI，NitroGen 基于 OpenVision 的动作建模，目标是成为能够在各种虚拟世界中自由穿梭的“通用代理”。

为让 NitroGen 掌握复杂的操控规律，研究团队挖掘了一个过去少被系统利用的“资料库”：YouTube 和 Twitch 上带有控制器叠加层的游戏实况视频。通过解析 1000 余款游戏、累计超过 4 万小时的玩家影像，NitroGen 学会了如何依据视觉反馈直接生成操作指令。据 AIbase 介绍，研究人员结合模板匹配与经微调的 SegFormer 模型，从海量视频中精准还原玩家的实时按键输入数据。

在技术架构层面，NitroGen 深度融合了英伟达先前发布的GR00TN1.5 机器人模型，使其具备跨平台的适应能力。测试结果表明，NitroGen 能胜任动作角色扮演、平台跳跃、Roguelike 等多种截然不同的游戏类型。即使置于完全陌生、从未见过的游戏环境中，其成功率也比从头训练的模型高出 52%，进一步验证了机器人基础模型在虚拟场景中的通用性。

目前，这一由英伟达、斯坦福与加州理工学院等顶尖学术机构联合推进的项目，已正式开源论文、代码及相关数据集，以推动全球 AI 社区在具身智能与通用代理方向的深入探索。

划重点:

🎮 海量数据驱动: 模型以 YouTube 与 Twitch 超过 4 万小时的游戏视频为训练基础，通过识别画面中的虚拟手柄按键，学习人类玩家的操作逻辑。
🚀 卓越的通用性: NitroGen 展示出机器人基础模型可充当通用智能体；在全新、未见过的游戏任务上，相比传统模型成功率提升了 52%。
🔓 全面开源共享: 英伟达携多所高校已公开 NitroGen 的模型权重、代码与数据集，为通用 AI 智能体的发展奠定重要基础。

如果你对 NitroGen 的技术细节感兴趣，要不要我详细讲讲它如何从视频中提取并还原操作逻辑？