Mistral 推出 Devstral2 开源编程模型：1230 亿参数，成本仅为 Claude Sonnet 的 1/7-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

Mistral AI 发布第二代开源编码模型家族：Devstral2（旗舰款，1230 亿参数）与 Devstral Small2（轻量款，240 亿参数）。旗舰模型在 SWE-Bench Verified 取得 72.2% 成绩，刷新开源阵营最佳纪录；官方称其成本仅为 Claude Sonnet 的七分之一，并同步开源 CLI 工具 Mistral Vibe，支持用自然语言批量改代码。两款模型均已接入 API，Devstral2 输入每百万 token 0.40 美元，轻量版完全免费。

模型速览：大小双档，开源并行

性能突破：72.2% 冠开源代码模型

– SWE-Bench Verified：Devstral2 拿下 72.2%，超越 CodeLlama-70B（53.8%）、DeepSeek-Coder-33B（61.4%），距 GPT-4-Turbo（73.2%）仅 1pp

– HumanEval：Pass@1 达到 84.1%，领先同类开源模型约 6–8pp

– 成本：官方称“价格仅为 Claude Sonnet 的 1/7”；输入 0.4$/M 约等于 GPT-4-Turbo 的五分之一

开源工具：Mistral Vibe —— 自然语言批量改代码

– 功能：一句“把函数改成异步”即可自动重写整个仓库，支持 diff 预览与回滚

– 引擎：本地调用 Devstral Small2（Apache-2.0），离线可用

– 集成：VS Code 插件已上架，支持一键修复 ESLint 问题或补充单测

商业策略：轻量免费 + 旗舰 API，分层覆盖

– Devstral Small2：Apache-2.0，支持商用、微调与嵌入

– Devstral2：修改版 MIT 许可，月营收超过 2000 万美元需购买商业授权或使用官方 API，避免“大厂白用”

– API 定价：输入 0.4$/M、输出 1.2$/M；前 30 天赠送 100 万 token

行业信号：开源代码模型迈入“70+ 俱乐部”

– 2024 年主流开源代码模型在 SWE-Bench 多为 50–60%；Devstral2 直接将门槛拉至 72%+

– 低成本 + 高分，将冲击 GitHub Copilot、Cursor 等付费插件的性价比

– 轻量版完全免费，有望加速“本地 AI 编码助手”普及；开发者用 RTX 4090 即可运行 24B 模型

下一步：2025 路线图

– Q1：发布 Devstral2-INT4 量化版，单张 A100 即可运行；推出 Jetson Orin 边缘部署包

– Q2：开放 128k 上下文版本，支持将整仓代码与文档作为 prompt

– Q3：上线“Vibe Cloud”——在浏览器内以自然语言重构整包代码，按项目计费

编辑结语

当“代码生成”来到 70+ 分的档位，竞争焦点已从“模型能力”转向“成本与合规”。Devstral2 以 0.4 美元/百万 token 压低价格，并通过“修改版 MIT”堵住大型企业免费商用漏洞；轻量版则彻底开源，占领本地部署心智。对开发者而言，“免费 24B + 低价 1230 亿参数”的组合意味着：本地写代码、云端跑重活，订阅类 Copilot 不再刚需。后续将持续关注其量化版本与 128k 长上下文的发布进展。