上线速度惊人!京东云率先接入 MiniMax M3 大模型,推理能力实现明显跃升

今天,MiniMax M3 模型已正式对外发布,京东云 JoyBuilder 模型开发平台也同步完成了接入,并在第一时间向广大用户开放了相关服务。

这次升级的重点,主要体现在推理能力的明显提升上。在应用部署层面,平台依托自研推理框架,同时深入结合了 PD 分离部署、KV Cache 缓存以及投机采样等多种先进的推理优化技术。

在这一系列底层能力共同配合下,新接入模型在实际运行过程中带来了更高的推理吞吐表现,整体响应速度也有了明显提升。这不仅能够为开发者带来更加顺畅的调用体验,也将进一步推动前沿大模型在更多实际业务场景中的落地与应用。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享