12月1日 — 中国人工智能初创公司深度求索(DeepSeek AI)发布了 DeepSeek-V3.2 系列。该系列包含 DeepSeek-V3.2 以及其高算力增强版 DeepSeek-V3.2-Speciale。新一代模型引入创新的稀疏注意力机制(DSA)并强化了 Agent 能力,目标是挑战全球顶级AI 模型,包括 OpenAI 的 GPT-5 和 Google 的 Gemini 3.0 Pro。

DeepSeek-V3.2 的核心是自研的 DeepSeek Sparse Attention(DSA)架构。该机制首次实现细粒度稀疏注意力,在长文本情况下显著降低计算量与内存占用,同时保持接近密集注意力模型的效果。由此带来显著效率提升:
- 长文本任务推理速度提升约 2–3 倍。
- API 成本下降,官方称价格下调超过 50%。
DeepSeek-V3.2 被定位为“Agent 优先”的模型,聚焦把深度推理与工具调用流程深度结合。模型通过大规模 Agent 任务合成流水线训练,增强了在真实应用场景中的泛化能力。新版本加入“思考模式”,可在执行复杂任务前进行链式推理,显著提升问题求解准确率。在多项 Agent 评测中,V3.2 达到了开源模型中的最高水平。

本次发布提供两个主要版本:
- DeepSeek-V3.2:已上线深度求索的网页端、App 与 API 服务。该版本在效率与性能间取得平衡,适合日常推理助手与开发场景。
- DeepSeek-V3.2-Speciale:面向极限推理的高算力增强版,目前仅通过临时 API 开放。官方表示,该版本在部分高难度推理任务上超过 GPT-5,并在 2025 年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)竞赛中取得了金牌级别的成绩。
深度求索已在 Hugging Face 开放 V3.2 模型权重,并提供相关开源内核与演示代码,方便研究与企业级商用部署。业内人士认为,DeepSeek V3.2 的发布标志着行业正迈向“深度推理 + 实际工具操作”的新阶段,进一步缩小了开源与闭源头部模型的差距。开发者可查阅 DeepSeek API 文档获取更多技术细节与使用指南。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?