科大讯飞大模型训练再加速:国产算力逼近 A100 水平

近日,科大讯飞在交流平台分享好消息:经过数年持续投入,他们在星火大模型的训练与推理效率上实现了明显提升。不同于完全依赖英伟达显卡的传统路径,科大讯飞选择走全国产化算力路线。在资源受限的情况下,团队携手华为,攻克了多项关键技术难题。

自 2023 年 5 月起,双方合作陆续突破多项瓶颈:万卡级高速互联组网、计算与通信协同优化,以及高吞吐推理等关键环节相继提速。得益于这些进展,科大讯飞通用大模型与深度推理类模型的训练效率已由早期的 30%—50% 提升到 85%—95%,整体表现出众,几乎比肩英伟达 A100。

到了 2025 年,科大讯飞继续加码,攻下国产算力训练的两项关键难关:其一,长思维链强化学习训练效率从对标 A800 时的约 30% 拉升至 84% 以上;其二,MoE 模型端到端训练效率实现跃迁,自今年 3 月的约 30% 提至 93%。这些结果既体现了国产算力的显著进步,也为科大讯飞在相关领域夯实了基础。

随着国产算力持续演进,科大讯飞的训练成本有望明显下降。这不仅为公司后续发展释放更大空间,也为中国科技产业的自主创新提供了示范。

总体来看,科大讯飞的阶段性成果既展现出其在大模型训练上的技术实力,也为国产算力的长期发展注入了强信心。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享