Mistral 推出 Devstral2 开源编程模型:1230 亿参数,成本仅为 Claude Sonnet 的 1/7

Mistral AI 发布第二代开源编码模型家族:Devstral2(旗舰款,1230 亿参数)与 Devstral Small2(轻量款,240 亿参数)。旗舰模型在 SWE-Bench Verified 取得 72.2% 成绩,刷新开源阵营最佳纪录;官方称其成本仅为 Claude Sonnet 的七分之一,并同步开源 CLI 工具 Mistral Vibe,支持用自然语言批量改代码。两款模型均已接入 API,Devstral2 输入每百万 token 0.40 美元,轻量版完全免费。

模型速览:大小双档,开源并行  

image.png

性能突破:72.2% 冠开源代码模型  

– SWE-Bench Verified:Devstral2 拿下 72.2%,超越 CodeLlama-70B(53.8%)、DeepSeek-Coder-33B(61.4%),距 GPT-4-Turbo(73.2%)仅 1pp  

– HumanEval:Pass@1 达到 84.1%,领先同类开源模型约 6–8pp  

– 成本:官方称“价格仅为 Claude Sonnet 的 1/7”;输入 0.4$/M 约等于 GPT-4-Turbo 的五分之一

开源工具:Mistral Vibe —— 自然语言批量改代码  

– 功能:一句“把函数改成异步”即可自动重写整个仓库,支持 diff 预览与回滚  

– 引擎:本地调用 Devstral Small2(Apache-2.0),离线可用  

– 集成:VS Code 插件已上架,支持一键修复 ESLint 问题或补充单测

商业策略:轻量免费 + 旗舰 API,分层覆盖  

– Devstral Small2:Apache-2.0,支持商用、微调与嵌入  

– Devstral2:修改版 MIT 许可,月营收超过 2000 万美元需购买商业授权或使用官方 API,避免“大厂白用”  

– API 定价:输入 0.4$/M、输出 1.2$/M;前 30 天赠送 100 万 token

行业信号:开源代码模型迈入“70+ 俱乐部”  

– 2024 年主流开源代码模型在 SWE-Bench 多为 50–60%;Devstral2 直接将门槛拉至 72%+  

– 低成本 + 高分,将冲击 GitHub Copilot、Cursor 等付费插件的性价比  

– 轻量版完全免费,有望加速“本地 AI 编码助手”普及;开发者用 RTX 4090 即可运行 24B 模型

 下一步:2025 路线图  

– Q1:发布 Devstral2-INT4 量化版,单张 A100 即可运行;推出 Jetson Orin 边缘部署包  

– Q2:开放 128k 上下文版本,支持将整仓代码与文档作为 prompt  

– Q3:上线“Vibe Cloud”——在浏览器内以自然语言重构整包代码,按项目计费

 编辑结语  

当“代码生成”来到 70+ 分的档位,竞争焦点已从“模型能力”转向“成本与合规”。Devstral2 以 0.4 美元/百万 token 压低价格,并通过“修改版 MIT”堵住大型企业免费商用漏洞;轻量版则彻底开源,占领本地部署心智。对开发者而言,“免费 24B + 低价 1230 亿参数”的组合意味着:本地写代码、云端跑重活,订阅类 Copilot 不再刚需。后续将持续关注其量化版本与 128k 长上下文的发布进展。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享