低成本、轻量化方案 蚂蚁数科推出具身智能真实数据采集框架

近日,具身智能真实数据采集迎来重要进展。蚂蚁数科天玑实验室推出的 AoE(Always-On Egocentric)持续性第一人称视频采集框架,给出了一套轻量且低成本的具身数据采集方案。只需一部手机加一款低于20美元的颈挂式支架,就能替代动辄数万美元的专业设备,完成高质量的数据采集。该方案有效缓解了具身数据采集成本高、难以规模化的难题。目前,相关论文已在 Arxiv 发布。

image.png

随着基础模型不断演进,模型的泛化与跨场景适配越来越依赖真实世界交互数据的规模、质量与覆盖。AoE 的关键在于把“人+手机”变成可长期运行的数据节点,其载体是一款符合人体工学的颈挂式支架,通过机械夹具、磁吸等方式将手机稳固在胸前,持续获取贴近用户视角的第一人称画面,从而完整记录自然交互过程。

在保持毫米级轨迹精度和90%以上手部关键点识别准确率的同时,该方案还能支持数千台设备并发采集与云端自动化处理。实测显示,面向 Unitree G1 机器人的关电脑任务,仅用50条遥操作数据成功率为45%,加入200条 AoE 数据后,成功率提升至95%。当数据稀缺时,AoE 承担了“启动学习”的关键补位。

image.png

低成本采集只是起点。论文指出,团队已攻克“长视频转化为训练数据”的技术难题:端侧轻量级视觉模型会自动识别手物交互并触发录制,利用大语言 – 视觉模型把连续视频切分为带语义标签的原子动作片段,最终由云端完成自动标注、过滤与清洗,使手机录制的视频自动变成高质量、标准化的训练数据。

同时,AOE 构建了端云协同方案,把采集、预处理、清洗、筛选与调度实现自动化,在减少人工干预的前提下,提高整体吞吐量。

记者留意到,蚂蚁数科正加大 AI toB 布局。面向产业落地,旗下天玑实验室重点发力 AI+数据、AI+安全、AI+金融与 AI+具身智能等方向,加速技术成果转化与应用。进入2026年,蚂蚁数科在 AI 领域动作频频,已宣布成立“大模型技术创新部”,并计划推出企业级大模型产品。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享