Mistral AI 发布第二代开源编码模型家族:Devstral2(旗舰款,1230 亿参数)与 Devstral Small2(轻量款,240 亿参数)。旗舰模型在 SWE-Bench Verified 取得 72.2% 成绩,刷新开源阵营最佳纪录;官方称其成本仅为 Claude Sonnet 的七分之一,并同步开源 CLI 工具 Mistral Vibe,支持用自然语言批量改代码。两款模型均已接入 API,Devstral2 输入每百万 token 0.40 美元,轻量版完全免费。
模型速览:大小双档,开源并行

性能突破:72.2% 冠开源代码模型
– SWE-Bench Verified:Devstral2 拿下 72.2%,超越 CodeLlama-70B(53.8%)、DeepSeek-Coder-33B(61.4%),距 GPT-4-Turbo(73.2%)仅 1pp
– HumanEval:Pass@1 达到 84.1%,领先同类开源模型约 6–8pp
– 成本:官方称“价格仅为 Claude Sonnet 的 1/7”;输入 0.4$/M 约等于 GPT-4-Turbo 的五分之一
开源工具:Mistral Vibe —— 自然语言批量改代码
– 功能:一句“把函数改成异步”即可自动重写整个仓库,支持 diff 预览与回滚
– 引擎:本地调用 Devstral Small2(Apache-2.0),离线可用
– 集成:VS Code 插件已上架,支持一键修复 ESLint 问题或补充单测
商业策略:轻量免费 + 旗舰 API,分层覆盖
– Devstral Small2:Apache-2.0,支持商用、微调与嵌入
– Devstral2:修改版 MIT 许可,月营收超过 2000 万美元需购买商业授权或使用官方 API,避免“大厂白用”
– API 定价:输入 0.4$/M、输出 1.2$/M;前 30 天赠送 100 万 token
行业信号:开源代码模型迈入“70+ 俱乐部”
– 2024 年主流开源代码模型在 SWE-Bench 多为 50–60%;Devstral2 直接将门槛拉至 72%+
– 低成本 + 高分,将冲击 GitHub Copilot、Cursor 等付费插件的性价比
– 轻量版完全免费,有望加速“本地 AI 编码助手”普及;开发者用 RTX 4090 即可运行 24B 模型
下一步:2025 路线图
– Q1:发布 Devstral2-INT4 量化版,单张 A100 即可运行;推出 Jetson Orin 边缘部署包
– Q2:开放 128k 上下文版本,支持将整仓代码与文档作为 prompt
– Q3:上线“Vibe Cloud”——在浏览器内以自然语言重构整包代码,按项目计费
编辑结语
当“代码生成”来到 70+ 分的档位,竞争焦点已从“模型能力”转向“成本与合规”。Devstral2 以 0.4 美元/百万 token 压低价格,并通过“修改版 MIT”堵住大型企业免费商用漏洞;轻量版则彻底开源,占领本地部署心智。对开发者而言,“免费 24B + 低价 1230 亿参数”的组合意味着:本地写代码、云端跑重活,订阅类 Copilot 不再刚需。后续将持续关注其量化版本与 128k 长上下文的发布进展。


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?