智元推出 GO-2 具身大模型:首创“动作思维链”,再创行业 SOTA

据报道,智元机器人正式发布了新一代具身基座大模型 Genie Operator-2(简称 GO-2)。该模型的核心目标是打通从“逻辑推理”到“精准动作执行”的最后一公里,让机器人不仅能理解指令,还能稳定把事做成。

image.png

核心亮点:首创“动作思维链” (Action Chain-of-Thought)

GO-2带来一种全新的交互范式,重塑机器人的思考路径:

  • 不再“边看边做”: 有别于传统模型直接输出控制信号,GO-2 会先在内部生成一段高层动作步骤,用作任务的整体规划。

  • 先想明白再动手: 依靠这种结构化的中间表示,机器人完成了从“感知输入”到“动作空间推理”的跨越。相关成果已被 AI 顶级会议 CVPR2026 收录。

架构升级:异步双系统让“执行不跑偏”

为解决机器人执行环节的稳定性难题,智元打造了一套精细协作的异步体系:

  • 慢系统(智囊): 低频运行,持续输出具备长程逻辑的动作规划“意图流”。

  • 快系统(肌肉): 高频运行,实时对齐慢系统的计划。遇到桌面高度偏差或物体滑动时,快系统会瞬时修正,确保最终动作紧贴预设轨迹。

成绩亮眼:多项基准测试刷新 SOTA

在多项评估具身智能实力的权威测试中,GO-2表现强劲:

  • LIBERO Benchmark: 平均成功率高达 98.5%,在四类核心任务中均位列全球第一

  • Genie Sim3.0: 仅用仿真数据训练,真实环境测试成功率达 82.9%,显著领先竞品(如 π0.5)。

产业愿景:从“实验室”迈向“生产线”

智元机器人不止发布了一个模型,更搭建了一套闭环学习体系:

  • 分布式进化: 借助Genie Studio平台,模型能在真实环境中持续采集交互数据并在线优化,实现“用得越多越聪明”。

  • 通用大脑: GO-2致力于成为具身智能的通用大脑,助力机器人从虚拟仿真平滑过渡到复杂的产业落地场景。

结语:迈入“知行合一”的机器人时代

正如智元官方所说,具身智能的终极追求是把理解与执行合为一体。随着 GO-2 的落地,机器人正从只会纸上谈兵的“思考者”,成长为能精准改变物理世界的“实干家”。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享