6月16日,阿里巴巴正式推出千问具身智能大模型Qwen-Robot系列。该系列主要由VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav,以及世界模型Qwen-RobotWorld三大核心模块构成。这一动作意味着大型科技企业在具身智能基础模型方向的布局继续加快,也让机器人操作、导航和物理规律推理三项能力实现更紧密的协同。

针对传统VLA模型在更换硬件或切换场景后迁移能力偏弱这一行业难题,Qwen-RobotManip加入了一套80维统一动作表征,为不同类型的硬件建立了通用的“动作语言”,让它们在不同设备上只需少量反馈就能完成自动适配。承担移动与识路任务的VLN模型Qwen-RobotNav则建立在Qwen-VL基础之上,首次把语言指令导航、目标搜索、自动驾驶等五大任务类别整合进同一个框架,降低了复杂任务中频繁切换模型的成本。
作为系统“思考中枢”的Qwen-RobotWorld,则让整套系统具备了对物理世界进行推理的能力,能够提前预测并模拟下一步动作和状态。当前,具身智能正处在从单一场景迈向通用泛化的重要阶段,阿里此次同步发布三款模型,通过技术架构解耦和多模态能力融合,有望进一步推动异构机器人通用化部署加快落地。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 9个月前0
粘贴不了啊用户12648782 10个月前0
用法杂不对呢?yfarer 10个月前0
草稿id无法下载,是什么问题?