国内人工智能赛道中的知名企业稀宇科技 MiniMax,今天正式对外宣布开源其原生多模态旗舰模型 MiniMax M3。此前,官方已经提前向行业开放了这款模型的权重,同时发布了含金量很高的稀疏注意力机制论文,迅速吸引了开源社区的大量关注。

综合表现位居开源前列
作为 MiniMax 重点打造的旗舰模型,M3 的总参数量达到 428B,激活参数为 23B。值得关注的是,这也是业内首个在底层训练早期阶段,就直接采用多模态混合训练方式的开源大模型。
依靠出色的技术架构,M3 在发布后仅用两周时间,就在权威全球综合智能指数榜单中拿下了开源模型的第一。针对上线初期因访问量激增带来的延迟问题,官方已将模型输出速度从 30 TPS 提升到了 80 TPS,后续还会继续优化速度。
领先的编码与代码交付能力
在多项高难度编码和智能体能力测试中,MiniMax M3 都展现出了行业领先的技术实力。它不但能够自主拆分复杂任务,还可以熟练调用多种外部工具完成多步骤推理。
和传统模型相比,M3 在代码生成方面有了明显提升。官方表示,它输出的代码目标是直接达到可交付水平,而不是“虽然能运行,但还需要人工做大量修改”的半成品,这将进一步提升开发者的工作效率。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 9个月前0
粘贴不了啊用户12648782 10个月前0
用法杂不对呢?yfarer 10个月前0
草稿id无法下载,是什么问题?