京东云 JoyBuilder 搭载 GR00T N1.5 千卡训练,推动具身智能加速规模落地

 近日,京东云JoyBuilder模型开发平台完成重要升级,成功支撑业内领先模型GR00T N1.5进行千卡级训练。

这一进展让JoyBuilder成为业内首个可支持具身智能千卡级LeRobot开源训练框架的AI开发平台,并在训练效率上取得大幅跃升,相比社区版快约3.5倍。通过软硬件协同优化与算法改进,JoyBuilder显著提升了训练效率与稳定性:原本需要15小时处理的1亿多条数据的千卡训练,如今仅用22分钟即可完成,大幅加速具身智能的规模化落地。

人工智能,机器人

为了达成上述效率提升,京东云AI Infra及相关团队围绕具身智能的训练场景,对JoyBuilder做了全栈优化。在数据链路上,平台重构了数据预处理与加载流程,实现了CPU端数据处理与GPU计算的异步并行,有效减少等待时间;针对海量小文件,自研高性能并行文件系统云海JPFS通过分布式元数据管理与智能预取,在1024卡集群上提供了超过400GB/s的读取带宽,确保数据持续高速供给。

在具身模型计算侧,团队面向主流的VLA(视觉-语言-动作)模型的计算特征,从Attention层、Token裁剪与训练后量化等环节做了深度优化。同时,在基础设施上构建了3.2T RDMA后端网络,基于多轨优化、拓扑感知调度与智能震荡抑制,保障千卡规模下集合通信的高吞吐与低时延,支持长时间稳定训练,并通过云原生的AI数据湖优化数据调度与流水线,进一步提升端到端效率。

依托全链路优化,JoyBuilder兼容当前主流的LeRobot训练数据最新版协议,巩固其在具身智能AI开发平台领域的领先地位。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享