距离春节还有约一个月,全球大模型圈再次把目光投向中国的明星初创 DeepSeek。多位知情人士称,DeepSeek 计划在数周内推出新一代旗舰模型 DeepSeek V4。作为去年引发行业热议的 DeepSeek V3 的升级版,V4 据说会重点加强代码生成,直击当前竞争最激烈的 AI 编程赛道。
据 DeepSeek 内部早期评测显示,DeepSeek V4 在写代码方面表现很强,在部分指标上甚至超过目前的顶尖模型 Claude 和 ChatGPT。此前业内也有消息称,DeepSeek 后续的模型架构可能不再刻意区分通用能力与推理能力,因此 V4 很有可能已经深度融合了传闻中的推理模型 DeepSeek R2,以获得更高效的逻辑处理与代码生成表现。
尽管这类消息在社交平台与行业圈传播甚广,也有媒体提出质疑,认为部分描述用词不够严谨,不排除是 AI 生成的虚假信息。不过回看 DeepSeek 去年春节前发布 R1 的节奏,很多业内人士认为其在春节前后有所动作依旧合乎逻辑。
除了软件层面的升级,本次发布或许也会带来国产芯片领域的最新进展。虽然官方尚未公开官宣,但市场对这款“国产自研编程利器”的期待已拉满。DeepSeek V4 能否如期登场并再次刷新开源大模型的性能上限,仍需时间检验。
划重点:
-
🚀 发布时机: DeepSeek V4 预计在春节前后亮相,延续重要节点发布重磅更新的节奏。
-
💻 编程强化: 新模型主打 AI 编程能力,内部评测称其代码生成水平有望超过 Claude 与 ChatGPT。
-
🛠️ 架构融合: V4 或不再区分通用与推理模型,通过技术融合整体提升逻辑处理与编码效率。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?