近日,京东云JoyBuilder模型开发平台完成重要升级,成功支撑业内领先模型GR00T N1.5进行千卡级训练。
这一进展让JoyBuilder成为业内首个可支持具身智能千卡级LeRobot开源训练框架的AI开发平台,并在训练效率上取得大幅跃升,相比社区版快约3.5倍。通过软硬件协同优化与算法改进,JoyBuilder显著提升了训练效率与稳定性:原本需要15小时处理的1亿多条数据的千卡训练,如今仅用22分钟即可完成,大幅加速具身智能的规模化落地。

为了达成上述效率提升,京东云AI Infra及相关团队围绕具身智能的训练场景,对JoyBuilder做了全栈优化。在数据链路上,平台重构了数据预处理与加载流程,实现了CPU端数据处理与GPU计算的异步并行,有效减少等待时间;针对海量小文件,自研高性能并行文件系统云海JPFS通过分布式元数据管理与智能预取,在1024卡集群上提供了超过400GB/s的读取带宽,确保数据持续高速供给。
在具身模型计算侧,团队面向主流的VLA(视觉-语言-动作)模型的计算特征,从Attention层、Token裁剪与训练后量化等环节做了深度优化。同时,在基础设施上构建了3.2T RDMA后端网络,基于多轨优化、拓扑感知调度与智能震荡抑制,保障千卡规模下集合通信的高吞吐与低时延,支持长时间稳定训练,并通过云原生的AI数据湖优化数据调度与流水线,进一步提升端到端效率。
依托全链路优化,JoyBuilder兼容当前主流的LeRobot训练数据最新版协议,巩固其在具身智能AI开发平台领域的领先地位。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?