小米开源3090亿参数MiMo-V2-Flash:推理速度领先主流竞品,API最低0.1美元/百万Token

小米正式踏入高性能开源大模型领域。近日,公司发布全新基础语言模型 MiMo-V2-Flash,并以 MIT协议全面开源 模型权重与推理代码。该模型主打“超高速、高效率”,在推理、代码生成与智能体任务中表现突出,实测响应速度甚至超越当前热门的豆包、DeepSeek和元宝等国产模型,迅速引发开发者社区关注。

image.png

MiMo-V2-Flash采用稀疏激活架构,总参数量达3090亿,但单次推理仅激活约150亿参数,在保持强大能力的同时大幅降低计算开销。该设计让其在多项公开基准测试中稳居开源模型第一梯队,兼顾性能与成本效率。

网友实测显示,MiMo-V2-Flash的响应速度“快得出乎意料”——在相同硬件条件下,其生成延迟明显低于DeepSeek等竞品,尤其在多轮对话与复杂逻辑推理场景中优势更为明显。有开发者评价:“不是快一点,是快一个量级。”

小米MiMo-V2-Flash大模型发布 回答速度出乎网友意料 比DeepSeek快

为加速生态落地,小米同步推出颇具竞争力的API定价:每百万输入Token仅0.1美元,输出Token为0.3美元,并提供限时免费试用。该价格显著低于主流商业模型,为中小企业与独立开发者提供高性价比替代方案。

值得注意的是,MiMo-V2-Flash并非只面向开发者,其通用能力也覆盖日常AI助手场景,可无缝融入手机、智能家居、车载系统等小米“人车家全生态”终端。就在模型发布当天,小米将举办 人车家全生态合作伙伴大会,预计将进一步披露MiMo-V2-Flash在端云协同、设备端部署及多模态扩展等方面的深度应用规划。

小米MiMo-V2-Flash大模型发布 回答速度出乎网友意料 比DeepSeek快

在国产大模型竞争白热化之际,小米以“高性能+真开源+低门槛”组合切入,不仅展现其AI战略的长期决心,也有望重塑开源模型的性能与成本预期。当3090亿参数的巨模型也能“快如闪电”,大模型赛道又迎来一位不容忽视的重量级玩家。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享