小米开源3090亿参数MiMo-V2-Flash：推理速度超越主流竞品，API低至每百万Token 0.1美元-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

小米宣布发力高性能开源大模型赛道。近日推出全新基础语言模型 MiMo-V2-Flash，并以 MIT 许可完整开源模型权重与推理代码。该模型主打「超高速、低成本」与高效推理，在代码生成和智能体等场景表现突出。多方实测显示，其响应速度较热门的豆包、DeepSeek、元宝等国产模型更快，迅速引发开发者关注。

MiMo-V2-Flash 采用稀疏激活架构，总参数达到 3090 亿，但单次推理仅激活约 150 亿参数，在保证能力的同时大幅降低计算消耗。依托该设计，模型在多项公开基准中稳居开源模型第一梯队，实现性能与成本的平衡。

网友实测反馈称，MiMo-V2-Flash 的响应速度“快到意想不到”——在相同硬件条件下，生成延迟显著低于 DeepSeek 等竞品，尤其在多轮对话与复杂逻辑推理场景中优势更明显。有开发者直言：“不是快一点，是快一个量级。”

为加速生态落地，小米同步推出极具竞争力的 API 定价：输入每百万 Token 0.1 美元、输出 0.3 美元，并提供限时免费试用。该价格远低于主流商业模型，为中小企业与独立开发者提供更高性价比的选择。

值得一提的是，MiMo-V2-Flash 不止面向开发者，其通用能力同样适配日常 AI 助手场景，可无缝融入手机、智能家居、车载系统等小米“人车家全生态”终端。发布当天，小米将举办人车家全生态合作伙伴大会，预计进一步披露端云协同、设备端部署及多模态扩展等方面的应用规划。

在国产大模型竞争愈发激烈的当下，小米以“高性能+真开源+低门槛”的组合拳切入，不仅展现其 AI 战略的长期定力，也可能重塑开源模型的性能与成本预期。当 3090 亿参数的巨型模型也能“快如闪电”，这一赛道又迎来一位不容忽视的重量级选手。

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

每日资讯

小米开源3090亿参数MiMo-V2-Flash：推理速度超越主流竞品，API低至每百万Token 0.1美元

剪映助手-剪辑小助手使用教程

绘想 – 百度推出的AI视频生成平台

拍我AI – PixVerse国内版AI视频生成平台

度加创作工具 – 百度推出的一站式AIGC创作平台

AI日报生成

码上飞 – 对话式的AI智能软件开发平台