阶跃星辰推出 Step-DeepResearch:以“原子能力”为核心的低成本深度研究AI智能体

近期,阶跃星辰(StepFun)发布了一款面向深度研究的全新智能体模型——Step-DeepResearch。该模型拥有32B参数,旨在把传统的网页检索升级为更专业的研究式工作流,能够胜任长程推理、工具使用以及结构化报告撰写等复杂任务。

image.png

与市面上更多面向短问题检索优化的 Web Agent 不同,Step-DeepResearch更偏向真实科研与分析场景使用。它能洞察潜在搜索意图,在存在不确定性时进行多源交叉验证,并最终输出含引用的专业化报告。阶跃星辰团队表示,该模型基于 Qwen2.532B-Base 搭建,通过将完整研究流程内化为单智能体的决策链路,显著压缩推理成本。

为让 AI 拥有接近人类专家的研究实力,Step-DeepResearch重点强化了四类“原子能力”:规划与任务拆解、深度信息获取、反思与验证、以及专业报告生成。训练阶段结合高质量技术报告、财务文件与知识图谱数据,构建了庞大的合成数据流水线,使其在处理长程项目时表现出极高的稳定性。

目前,该模型在 Scale AI 的研究评测中达成了61.42%依从率,整体表现可与 OpenAI 与 Google 的同类深研系统相提并论。而在阶跃星辰自研的 ADR-Bench 中文基准上,这款32B模型甚至超过了部分更大参数的开源模型,体现出极高的实用性与成本优势。

论文:https://arxiv.org/pdf/2512.20491

划重点:

  • 🧠 单智能体架构Step-DeepResearch将规划、检索、验证与撰写整合为模型自身的原子能力,无需串联多个外部智能体,效率更高、成本更低。

  • 📚 深度科研导向:区别于简单问答型检索,模型支持最高128k上下文,可从超过2000万篇论文与权威索引中抓取信息,输出严谨的结构化研究报告。

  • 🏆 性能表现强劲:在多项深度研究评测中成绩亮眼,32B体量即可达到可与大参数闭源模型比肩的专业研究水平。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享