国产多模态大模型取得新突破,MiniMax M3 宣布开源并大幅提速

国内人工智能赛道中的知名企业稀宇科技 MiniMax,今天正式对外宣布开源其原生多模态旗舰模型 MiniMax M3。此前,官方已经提前向行业开放了这款模型的权重,同时发布了含金量很高的稀疏注意力机制论文,迅速吸引了开源社区的大量关注。

image.png

综合表现位居开源前列

作为 MiniMax 重点打造的旗舰模型,M3 的总参数量达到 428B,激活参数为 23B。值得关注的是,这也是业内首个在底层训练早期阶段,就直接采用多模态混合训练方式的开源大模型。

依靠出色的技术架构,M3 在发布后仅用两周时间,就在权威全球综合智能指数榜单中拿下了开源模型的第一。针对上线初期因访问量激增带来的延迟问题,官方已将模型输出速度从 30 TPS 提升到了 80 TPS,后续还会继续优化速度。

领先的编码与代码交付能力

在多项高难度编码和智能体能力测试中,MiniMax M3 都展现出了行业领先的技术实力。它不但能够自主拆分复杂任务,还可以熟练调用多种外部工具完成多步骤推理。

和传统模型相比,M3 在代码生成方面有了明显提升。官方表示,它输出的代码目标是直接达到可交付水平,而不是“虽然能运行,但还需要人工做大量修改”的半成品,这将进一步提升开发者的工作效率。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享