DeepSeek-V3.2 正式亮相:推出创新稀疏注意力框架,API 费用减半,表现对标顶尖闭源模型

12月1日 — 中国人工智能初创公司深度求索(DeepSeek AI)发布了 DeepSeek-V3.2 系列。该系列包含 DeepSeek-V3.2 以及其高算力增强版 DeepSeek-V3.2-Speciale。新一代模型引入创新的稀疏注意力机制(DSA)并强化了 Agent 能力,目标是挑战全球顶级AI 模型,包括 OpenAI 的 GPT-5 和 Google 的 Gemini 3.0 Pro。

DeepSeek

DeepSeek-V3.2 的核心是自研的 DeepSeek Sparse Attention(DSA)架构。该机制首次实现细粒度稀疏注意力,在长文本情况下显著降低计算量与内存占用,同时保持接近密集注意力模型的效果。由此带来显著效率提升:

  • 长文本任务推理速度提升约 2–3 倍。
  • API 成本下降,官方称价格下调超过 50%。

DeepSeek-V3.2 被定位为“Agent 优先”的模型,聚焦把深度推理与工具调用流程深度结合。模型通过大规模 Agent 任务合成流水线训练,增强了在真实应用场景中的泛化能力。新版本加入“思考模式”,可在执行复杂任务前进行链式推理,显著提升问题求解准确率。在多项 Agent 评测中,V3.2 达到了开源模型中的最高水平。

13f9-d29ccb3fb6d58ae9db06bbc93a8f9a01.jpg

本次发布提供两个主要版本:

  1. DeepSeek-V3.2:已上线深度求索的网页端、App 与 API 服务。该版本在效率与性能间取得平衡,适合日常推理助手与开发场景。
  2. DeepSeek-V3.2-Speciale:面向极限推理的高算力增强版,目前仅通过临时 API 开放。官方表示,该版本在部分高难度推理任务上超过 GPT-5,并在 2025 年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)竞赛中取得了金牌级别的成绩。

深度求索已在 Hugging Face 开放 V3.2 模型权重,并提供相关开源内核与演示代码,方便研究与企业级商用部署。业内人士认为,DeepSeek V3.2 的发布标志着行业正迈向“深度推理 + 实际工具操作”的新阶段,进一步缩小了开源与闭源头部模型的差距。开发者可查阅 DeepSeek API 文档获取更多技术细节与使用指南。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享