在第九届数字中国建设峰会即将召开之际,中国移动自研的“九天”35B通用大模型将首次面向公众发布。作为国产算力生态的一项关键进展,摩尔线程日前表示,其旗舰全功能GPU MTT S5000已率先完成对该模型的全流程适配并通过推理验证。
本次适配的重点在于深度协同。依托自研的MUSA软件栈与SGLang-MUSA高性能推理引擎,摩尔线程打通了“九天”35B模型推理的完整链路。通过对MUSA C开发框架、muDNN计算库以及MATE开源算子库的联合优化,MTT S5000围绕大模型常见的注意力机制与长序列推理进行了定制增强,确保在处理长文本和高并发请求时依旧高效、稳定。

作为本次适配的硬件底座,MTT S5000表现亮眼。该卡采用第四代MUSA“平湖”架构,单卡AI稠密算力最高可达1000TFLOPS。硬件方面配备80GB大容量显存,带宽1.6TB/s,并覆盖从FP8到FP64的全精度计算;同时提供高达784GB/s的卡间互联带宽,为复杂智算任务下的横向扩展提供保障。
此次合作既验证了国产GPU在承载央企核心大模型方面的可靠性,也体现了摩尔线程在高性能算子优化与软件生态完善上的成熟度。随着“九天”35B模型正式发布,“国产大模型+国产算力”的组合将成为推进算力自主可控的又一具有参考价值的落地样本。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?