成绩亮眼却被社区群嘲？MiniMax全新旗舰模型M3 掀起明显分歧-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

大模型领域再次起了新动静。AI创业公司MiniMax最近正式推出了新一代旗舰大模型M3。从技术报告公开的多项基准测试（Benchmark）结果来看，这款模型的表现确实很抢眼：在被普遍认为更贴近真实软件工程环境的测试中，M3拿到了59%的优秀成绩，不但超过了GPT-5.5，还已经非常接近Opus4.7。另外，它还支持百万级上下文处理，并且具备原生多模态能力。不过，和这些强势技术数据形成强烈反差的是，M3发布之后在开发者社区里引发了不小争议，尤其在中文社区，负面声音更是非常集中。

业内争议的第一个关键点，在于评测结果背后是否足够透明。根据技术细节说明，M3在 Coding（代码）能力相关测试中，采用了竞品Claude Code作为评测脚手架。虽然在当前行业里，借助现成工具链来跑智能体（Agent）评测并不罕见，但MiniMax使用别人的框架来测试自家模型，再直接拿结果与对方同台比较并对外宣传，这种做法让不少程序员觉得“并不够坦率”。对于普通用户来说，也很难判断这些高分里，到底多少来自模型本身，多少又来自脚手架带来的额外加成。

另外，关于“开源”这件事是否拿出了足够诚意，也让开源社区感到疑惑。和其他厂商推出开源模型时的做法不同，MiniMax这次不仅没有公布M3的参数规模，也没有同步开放模型“权重”，只是表示会在发布后的10天内开源，目前外界只能通过API使用。由于开源社区一直看重“可复现、可验证”，这种先打出开源口号、却暂时不给权重、让大家无法在本地独立验证模型真实情况的方式，虽然从商业角度不难理解，但确实伤到了很多重视务实和透明的开发者。

而最让长期深度用户觉得“被背后捅了一刀”的，则是计费规则（Coding Plan）在没有预告的情况下被调整。此前，MiniMax因为采用按请求次数限速、但不设置月度Token总量上限的方式，被不少人认为是“量大够用”。但随着M3上线，官方也同步推出了新的Token Plan，把规则改成了按总量计费。虽然官方表示Plus套餐的Token价格依然很划算，但在百万上下文这种重度使用场景里，单次调用往往会消耗大量Token，新规则也就意味着套餐额度可能很快被用完，因此引来了老用户的集中不满。

如果先不看这些运营层面的争议，M3在底层架构上的创新其实还是有不少看点。它自研了一套名为MSA（MiniMax Sparse Attention）的稀疏注意力机制，通过对KV（Key-Value）进行高精度分块和稀疏化处理，突破了传统Transformer在长上下文计算时计算量迅速膨胀的问题。在底层算子设计上，这个模型还提出了新的计算聚合方式，让内存访问更加连续，速度相比开源的Flash-Sparse-Attention提升了4倍以上。这也让M3在百万上下文条件下的前向传播和解码速度分别提高了9倍和15倍，单Token计算量也下降到了上一代的一半。

单从技术路线来观察，M3在长上下文、多模态以及智能体能力上的整体均衡性，在国内厂商中仍然算比较突出的。不过，这次因为发布方式和运营策略上的一连串争议操作，技术本身的亮点反而被社区质疑声盖过去了。市场对M3持续关注，同时又出现明显情绪反弹，这说明开发者对这款产品其实依旧有期待。至于MiniMax能不能重新赢回社区信任，或许还要等10天后模型权重正式公开、接受独立评测之后，才会有更清晰的答案。