中国大模型正以“性价比”和“工程化”为核心,在全球开发者圈掀起强劲风潮。
2026 年 3 月 3 日,根据全球最大的 API 聚合平台
7 天吞吐 3.07 万亿 Token:MiniMax 的“爆发式”增长
自 2 月 13 日上线以来,MiniMax M2.5 用短短一周时间,将调用量推至 3.07T(3.07 万亿)Tokens。这款被称为“全球首个为智能体场景原生打造”的模型,正对准开发者的核心需求:
-
智能体(Agent)优先:不止能聊天,更能作为后台引擎完成复杂编程与自动化流程。
-
价格杀手:超低调用成本,让高频触发的 AI 应用可以放心搭建与迭代。
-
商业爆发:受益于 M2.5 的火热,MiniMax 2 月 ARR(年度经常性收入)直冲 1.5 亿美元,提前完成全年商业目标。
取舍的艺术:为何激活参数仅 10B?
在业内纷纷追逐千亿、万亿参数的背景下,MiniMax M2.5 的激活参数仅为 10B。官方给出的思路是,为了更好地平衡推理效率与实际产出。通过优化 MoE(专家混合)架构,MiniMax 证明小体量也能释放接近顶级模型的编程与逻辑能力。不过,相对有限的知识容量也成为当前用户反馈中的主要短板。
下周交锋:M3.0 对阵 DeepSeek V4
中国大模型竞争已进入“周更”节奏的白热化阶段:
-
DeepSeek 来袭:
DeepSeek V4 将于下周正式发布,全球社区正关注其最新的降本增效方案。 -
MiniMax 3.0 预告:稀宇科技计划在今年上半年推出 MiniMax M3 系列。
-
大摩看好:大摩(Morgan Stanley)最新研报称,M3.0 将在预训练与架构上进一步创新以弥补知识容量,同时带来更强的多模态理解,综合表现有望对标全球最顶级旗舰模型。

















用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?