2025 年 11 月 21 日,小米宣布推出并开源业内首个同时贯通自动驾驶与具身智能的跨域基础模型 MiMo-Embodied,模型与权重已在 Hugging Face 与 arXiv 同步上架。

技术亮点
1. 跨域能力覆盖:一套参数同时覆盖具身智能三类任务(可供性推断、任务规划、空间理解)与自动驾驶三类任务(环境感知、状态预测、行车规划),将室内交互与道路决策纳入统一建模。
2. 双向协同赋能:实验证明室内交互与道路决策之间存在知识迁移的相互促进,为跨场景智能融合带来新的思路。
3. 全链优化可靠:采用“具身/自驾能力学习→CoT 推理增强→RL 精细强化”的多阶段训练策略,显著提升真实环境中的部署可靠性。
性能表现
在覆盖感知、决策与规划的 29 项核心基准中,MiMo-Embodied 整体领先现有开源、闭源及专用模型:具身智能领域 17 项 Benchmark 取得 SOTA,自动驾驶领域 12 项 Benchmark 刷新最佳记录,并在通用视觉语言任务上展现出强泛化能力。
应用与生态
小米计划率先将 MiMo-Embodied 应用于自研扫地机器人、工厂 AGV 及 SU7 高阶智驾,并自 2026 年 Q1 起通过 OTA 推送;同时开放模型 API,面向家居、移动出行与制造业开发者提供跨域智能底座。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?