悬念足足三周的“神秘模型”终于官宣。此前,一个名为MotuBrain的模型在物理世界理解与动作执行两大国际基准中低调登顶,引发业内热议。近日,凭借视频大模型Vidu走红的生数科技正式确认,这款模型是其在具身智能方向的最新商业化落地。
这次“跨界”绝非尝鲜之举。MotuBrain在WorldArena(侧重物理世界理解)与RoboTwin2.0(侧重动作执行)两项评测中双双刷新纪录。尤其在含随机扰动的复杂环境里,它是唯一平均分突破95分的模型,展现出强悍的泛化能力。

“边看边动”:打通感知与行动
不同于传统“先想象再执行”的链路,MotuBrain采用创新的“世界动作模型”(World Action Model)思路。通过“边看边动”的机制,机器人一边决策一边推演,避免预测与执行误差相互放大,显著提升响应速度。
在真实演示中,搭载该系统的机器人展现出极高的智能化水平。以火锅场景为例,机器人能凭视觉判断勺子是否已舀空,并自主决定要不要再次捞取,而不是机械地重复预设动作。这种“察言观色”式的判断,意味着机器人正从简单执行迈向真正的智能决策。

一脑多型,长程任务顺畅衔接
MotuBrain的核心优势在于通用性极强。它不仅支持“一脑多型”,可匹配不同自由度、不同传感器配置的机器人本体,还具备“一脑贯通”的长程任务处理能力。在插花、调酒、整理沙发等演示里,机器人可连续完成10个以上原子动作,全程流畅,无需人工介入。
数据表明,随着任务类型的增多,MotuBrain的学习成功率反而持续上升。这意味着模型掌握的是物理世界的通用底层规律,而不是死记硬背的动作模板。任务越多样,表现越亮眼。
布局物理世界,数字与实体双轨并进
生数科技此次展现的能力,源自其扎实的技术积累。基于全球首创的U-ViT架构,团队实现了数字世界生成(VGM)与物理世界执行(WAM)的统一:左手Vidu构建虚拟世界,右手MotuBrain驱动物理交互。双轨并行的策略,让其在数据获取成本与模型迭代速度上具备明显优势。
目前,生数科技已与无界动力、星尘智能等多家企业达成战略合作。随着具身智能竞争重心的转移,拥有通用“大脑”的模型开发者,正成为重塑行业格局的关键力量。
用户38505528 8个月前0
粘贴不了啊用户12648782 9个月前0
用法杂不对呢?yfarer 9个月前0
草稿id无法下载,是什么问题?