小米开源3090亿参数MiMo-V2-Flash：推理速度领先主流竞品，API最低0.1美元/百万Token-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

小米正式踏入高性能开源大模型领域。近日，公司发布全新基础语言模型 MiMo-V2-Flash，并以 MIT协议全面开源模型权重与推理代码。该模型主打“超高速、高效率”，在推理、代码生成与智能体任务中表现突出，实测响应速度甚至超越当前热门的豆包、DeepSeek和元宝等国产模型，迅速引发开发者社区关注。

MiMo-V2-Flash采用稀疏激活架构，总参数量达3090亿，但单次推理仅激活约150亿参数，在保持强大能力的同时大幅降低计算开销。该设计让其在多项公开基准测试中稳居开源模型第一梯队，兼顾性能与成本效率。

网友实测显示，MiMo-V2-Flash的响应速度“快得出乎意料”——在相同硬件条件下，其生成延迟明显低于DeepSeek等竞品，尤其在多轮对话与复杂逻辑推理场景中优势更为明显。有开发者评价：“不是快一点，是快一个量级。”

小米MiMo-V2-Flash大模型发布回答速度出乎网友意料比DeepSeek快

为加速生态落地，小米同步推出颇具竞争力的API定价：每百万输入Token仅0.1美元，输出Token为0.3美元，并提供限时免费试用。该价格显著低于主流商业模型，为中小企业与独立开发者提供高性价比替代方案。

值得注意的是，MiMo-V2-Flash并非只面向开发者，其通用能力也覆盖日常AI助手场景，可无缝融入手机、智能家居、车载系统等小米“人车家全生态”终端。就在模型发布当天，小米将举办人车家全生态合作伙伴大会，预计将进一步披露MiMo-V2-Flash在端云协同、设备端部署及多模态扩展等方面的深度应用规划。

小米MiMo-V2-Flash大模型发布回答速度出乎网友意料比DeepSeek快