SuperCLUE 团队最新公布的 DeepSeek V4 中文大模型评测显示,DeepSeek‑V4‑Pro 以全面实力重回国内第一,Flash 版本紧随其后位列第二。这一成绩标志着国产开源模型在技术上再进一步。

本次评测覆盖数学推理、科学推理、代码生成、智能体任务规划、指令遵循和幻觉控制六个方向。DeepSeek‑V4‑Pro 以 70.98 分夺魁,Flash 版本取得 68.82 分,整体领先国内其他同类模型。
DeepSeek V4 系列引入全新注意力机制,支持百万级长上下文,同时有效降低算力与显存消耗。在国产芯片上的配合表现也更高效。对比上一代 V3.2,Pro 版在智能体能力方面提升超 20 分,数学推理接近 +10 分,指令遵循约 +12 分,幻觉控制同样有明显优化。

Flash 版本在保证高效推理的同时,智能体与数学推理能力也同步提升,性价比突出。Pro 版主打高性能,适合复杂任务与专业场景,价格为每百万 Tokens 15 元;Flash 版强调速度快、成本低,API 价格为每百万 Tokens 1.25 元,更适合日常使用。
需要说明的是,DeepSeek V4 虽然整体表现亮眼,但在代码生成与复杂指令执行方面,相比海外顶尖模型仍有差距。总体来看,凭借能力均衡与成本友好,DeepSeek V4 已在国内市场稳住阵脚,是日常办公、开发创作和长文本处理的优选。
划重点:
🌟 DeepSeek‑V4‑Pro 在最新评测中位居国内第一,Flash 版本紧跟其后。
🧠 六大维度全覆盖,Pro 版本得分 70.98 分。
💰 Pro 与 Flash 各有所长:前者适合复杂场景,后者主打高性价比,日常更友好。


















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?