Mistral开源发布Devstral 2:123B代码模型拿下SWE-bench 72.2分,免费API与本地CLI同步登场!

欧洲AI独角兽Mistral AI再推新品,面向编程场景发布全新开源模型家族Devstral 2,包含123B参数的旗舰Devstral2与24B参数的轻量版Devstral Small2。与此同时,官方还放出了开源命令行工具Mistral Vibe CLI,支持端到端自动化写代码。本次更新显著抬升开源编码Agent的天花板:Devstral2在权威基准SWE-bench Verified上取得72.2分,逼近顶级闭源模型;且API阶段性免费开放,对开发者极为友好。

image.png

 Devstral2家族登场,双尺寸覆盖企业与本地场景

Devstral2系列采用密集型Transformer架构,原生支持256K超长上下文。  

– Devstral2(123B):面向企业的主力模型,擅长工具调用、多文件联动编辑与大型代码库理解,在SWE-bench Verified上拿到72.2分,跻身开源权重模型中的顶尖梯队。  

– Devstral Small2(24B):更轻巧高效,可在消费级设备本地运行,支持图像输入,适用于隐私敏感与离线使用场景。  

两款模型均已开源:前者采用修改版MIT许可,后者为更宽松的Apache 2.0许可;目前通过官方API即可免费试用,大幅降低上手门槛。

 SWE-bench Verified 72.2分,开源编码Agent新王者

在面向真实GitHub问题的SWE-bench Verified上,Devstral2交出72.2%高分,相比多数开源对手优势明显;在参数规模更小的前提下实现强劲表现。与更大体量的闭源模型相比,其性价比可达7倍以上,尤其适合自动化重构、缺陷修复及多文件协同改动等大规模编程任务。

 Mistral Vibe CLI:终端里的全能编码Agent

由Devstral驱动的开源CLI工具Mistral Vibe,允许用自然语言直接操控代码库:  

– 自动解析项目结构与Git状态,提供精确上下文。  

– 支持@引用文件、!执行shell命令与斜杠指令进行个性化配置。  

– 面向整个代码仓进行理解与修改,而非只关注当前文件。  

– 内置持久对话、自动补全与可定制主题,交互体验顺滑。  

该工具可独立在终端运行,也能无缝接入IDE,真正实现“端到端自动化”,让开发者用对话式指令完成探索、修改到执行的全流程。

 生态整合与开放策略,加速分布式智能

Mistral此次升级强调“开放+实用”,已与多家开源Agent平台深度对接,便于快速集成。Devstral2不仅适配企业级生产场景,也为个人开发者提供本地部署选项,推动AI编程工具普惠落地。

这波更新进一步巩固了Mistral AI在开源赛道的领先位置。业内分析人士认为,Devstral2的高性价比与Vibe CLI的创新交互,有望引领“Vibe Coding”风潮,并对闭源产品格局发起冲击。感兴趣的开发者可立即通过官方API或Hugging Face体验,更多实测对比可关注后续的深度评测。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享