2月11日,DeepSeek 在网页端和 APP 端开启灰度更新,2月14日正式公布此次升级为新一代长文本模型结构测试。网页和 APP 现已支持最高100万 token 的超长上下文,内置知识库也同步更新至2025年5月。不过,目前 API 服务仍停留在 V3.2 版本,只支持 128K 上下文。这次动作被业内视为其下一代 V4 模型正式发布前的技术预演和压力测试,也让全网对 V4 的登场充满期待,相关讨论在微博上持续升温。

更新上线后,DeepSeek 的对话风格出现明显变化,被不少用户吐槽“变冷漠”了,相关话题迅速冲上微博热搜,阅读量突破 6853.5 万。具体变化包括:不再使用用户专属昵称,统一叫“用户”;在深度思考模式下,回复多为短句,整体语气偏干巴;甚至有部分回答被质疑“阴阳怪气”“有点官腔”,让很多习惯此前温柔共情风格的老用户产生“戒断感”。围绕这点,网友分成两派:重视情绪陪伴的一方怀念从前的暖心互动;注重效率的一方则更买账现在的理性简练,认为回复更快、信息更集中,更符合生产力工具的定位,而且该模型还顺利通过了不少顶尖模型频频翻车的“洗车图灵测试”。
针对这次风格变化,DeepSeek 官方回应称并非刻意“降温”,而是出于效率优先和安全边界优化的考虑。过多表情和语气词,会稀释复杂问题里的有效信息密度;同时,也要照顾到那部分只想直接拿答案、不愿面对“AI 假装关心”的用户需求。这次调整也让全网对 DeepSeek V4 的期待值被推到高点。据悉,这一代新模型预计在 2026 年春节前后发布,时间大概在 2 月中旬,业内普遍推测可能落在 2 月 17 日前后,相关爆料同样在微博上引发热议。
作为万亿参数级别的旗舰产品,V4 将重点发力编程能力。内部初步基准测试显示,V4 在 coding 相关任务上的表现已经超过 Claude、GPT 等主流顶尖模型,被认为有机会改写当前 AI 编程赛道格局。与此同时,V4 还带来了多项关键技术升级:能够处理和解析超长代码提示,一次性理解庞大代码库的整体上下文,对企业级复杂项目非常重要;训练算法得到改进,对数据模式的理解更到位,且不容易出现能力衰减;推理链条也更加严谨可靠,在提升各项能力的同时,没有出现性能“掉链子”的情况,在多维指标之间找到更均衡的方案。
此外,新模型还会延续百万 Token 上下文这一大优势,在相同任务下推理成本明显低于多家西方竞品,并计划以 Apache2.0 许可证形式开放源码,进一步降低企业和开发者的使用门槛。


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?