《The Information》称,深度求索计划在2月中旬(接近农历新年)发布新一代旗舰模型 DeepSeek-V4。该模型重点提升代码生成和长代码上下文理解能力,为开发者带来更有力的帮助。
相较于去年12月上线的 V3.2,DeepSeek-V4是一次明显的迭代。内部评测显示,其成绩已压过 Anthropic 的 Claude 系列与 OpenAI 的 GPT 系列。尤其在处理超长代码提示上表现突出,这一进步有望大幅提升其在复杂软件工程中的稳定性与推理精度。

据知情人士介绍,用户会明显感到 DeepSeek-V4 的答复更有条理,也更能体现其推理优势,因此在复杂任务上的可靠性更高。其训练采用了新的架构设计,面对长序列时更擅长识别数据规律,并能在有限算力下更高效地完成训练。
另一个看点是,DeepSeek-V4 的发布节奏与去年推出的 R1 相似。作为开源的推理模型,R1曾在全球引发广泛讨论,并助推中国大模型厂商在2025年掀起开源竞争热潮。
过去两年里,深度求索密集发布了多款模型,如 DeepSeek-Coder、DeepSeek-V2、DeepSeek-V3、DeepSeek-R1 等,覆盖代码生成、数学、多模态与推理等领域。这些成果既为开发者带来有力工具,也为 AI 发展注入新的动力。
尽管 DeepSeek 尚未正式回应相关消息,外界对 DeepSeek-V4 的期待已十分强烈。随着技术持续演进,深度求索有望继续在人工智能赛道中发挥关键作用。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?