DeepSeek V4 中文大模型测评:再夺国内榜首!

SuperCLUE 团队最新公布的 DeepSeek V4 中文大模型评测显示,DeepSeek‑V4‑Pro 以全面实力重回国内第一,Flash 版本紧随其后位列第二。这一成绩标志着国产开源模型在技术上再进一步。

image.png

本次评测覆盖数学推理、科学推理、代码生成、智能体任务规划、指令遵循和幻觉控制六个方向。DeepSeek‑V4‑Pro 以 70.98 分夺魁,Flash 版本取得 68.82 分,整体领先国内其他同类模型。

DeepSeek V4 系列引入全新注意力机制,支持百万级长上下文,同时有效降低算力与显存消耗。在国产芯片上的配合表现也更高效。对比上一代 V3.2,Pro 版在智能体能力方面提升超 20 分,数学推理接近 +10 分,指令遵循约 +12 分,幻觉控制同样有明显优化。

image.png

Flash 版本在保证高效推理的同时,智能体与数学推理能力也同步提升,性价比突出。Pro 版主打高性能,适合复杂任务与专业场景,价格为每百万 Tokens 15 元;Flash 版强调速度快、成本低,API 价格为每百万 Tokens 1.25 元,更适合日常使用。

需要说明的是,DeepSeek V4 虽然整体表现亮眼,但在代码生成与复杂指令执行方面,相比海外顶尖模型仍有差距。总体来看,凭借能力均衡与成本友好,DeepSeek V4 已在国内市场稳住阵脚,是日常办公、开发创作和长文本处理的优选。

划重点:  

🌟 DeepSeek‑V4‑Pro 在最新评测中位居国内第一,Flash 版本紧跟其后。  

🧠 六大维度全覆盖,Pro 版本得分 70.98 分。  

💰 Pro 与 Flash 各有所长:前者适合复杂场景,后者主打高性价比,日常更友好。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享