小米开放VLA大模型后训练全流程,机器人实现亚毫米级精密操控

小米在机器人技术领域再度放出“重磅消息”。继今年2月发布并开源其VLA大模型Xiaomi-Robotics-0后,今日小米正式公开该模型的真机后训练(Post-training)完整流程。此举旨在打通机器人从实验室走向实际生产的“最后一公里”,让AI机器人真正实现开箱即用,成为可直接投入使用的生产力工具。

image.png

最新的能力演示中,搭载该模型的机器人展现出令人惊叹的精细操控。通过仅约20小时的任务数据强化训练,Xiaomi-Robotics-0便成功掌握了“连续收纳耳机”这一高难度动作。画面里,机器人动作顺滑,能把细小的耳机逐一精准放入紧凑的收纳盒槽位。

这项看似简单的操作其实蕴含关键技术挑战:其一是精度难题,耳机与充电盒槽位的公差非常微小,要求模型具备亚毫米级空间感知,才能实现准确对位;其二是稳定性难题,由于耳机与盒体表面极为光滑(粗糙度低至Ra0.03μm),接触时极易滑动移位,模型必须具备极高的实时反馈与动作修正能力,才能避免装配失败。

image.png

值得关注的是,Xiaomi-Robotics-0在发布首月便跻身HuggingFace全球VLA模型下载榜前六,显示出极高的行业关注度。为进一步壮大开发者生态,小米已将该项目的技术报告、模型权重与源代码全面开放。

目前,开发者可通过小米机器人技术官网及GitHub等开源平台获取相关资源。随着后训练全流程的开源,业内普遍认为这将显著降低高性能机器人任务的开发门槛,加速智能机器人在复杂、精细场景中的落地应用。

技术官网:https://robotics.xiaomi.com/xiaomi-robotics-0.html#pack-earbuds

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享