前Qwen 核心成员发声:大模型正从“思考型”走向“行动型”

阿里通义千问(Qwen)前大模型技术负责人林俊旸在离职数周后,于 3 月 26 日晚间首次公开发声,系统解读了大模型技术的下一步演进方向。

他提到,行业正在从“推理式思维”迈向“智能体思维(Agentic Thinking)”。过去一年大家都在想办法让模型“多想一会儿”;而未来的关键在于,让模型为“付诸行动”而思考,并在与真实世界的互动中不断修正计划。

回看千问研发:硬把“思考”和“指令”揉到一起的代价

林俊旸在文中坦率回顾了千问团队在 2025 年初的探索与教训。当时团队雄心勃勃地想做出一套统一系统,让模型能按问题难度自动选择合适的推理强度。

但实践表明,推理类数据与指令类数据在分布上差异很大,强行合并后模型在两端都不出彩:需要思考时啰嗦且不够果断,执行指令时又不够稳定、开销还很高。也正因此,Qwen 随后改为分别推出 Instruct 与 Thinking 版本,这一经验给行业带来了重要的工程参考。

为“好思考”立新标:能支撑有效行动才算好

在他看来,推理链并非越长越好,盲目拉长逻辑链经常只是浪费算力。他预判,接下来研发重心会从只训练模型,转向把“模型+环境”作为整体去训练的智能体系统。

在这一新范式中,评估标准将从“能不能做出复杂数学证明”转向“能否在真实约束下通过持续交互不断推进”。这意味着,环境设计、多智能体协作以及评测器的可靠性,将走到 AI 研发的核心位置。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享