阶跃星辰推出 Step-DeepResearch:以“原子能力”为核心的低成本深研型 AI 智能体

近日,阶跃星辰(StepFun)发布了新一代深度研究智能体模型——Step-DeepResearch。这款模型拥有 32B 参数,旨在把传统的网页检索升级为更专业的研究流程,可胜任长链推理、工具调用与结构化报告写作等复杂任务。

image.png

不同于市面上更偏向短问题检索优化的 Web Agent,Step-DeepResearch专注真实的科研与分析场景。它能识别隐含的搜索意图,在不确定时进行多源交叉核验,并最终产出附引用的专业报告。官方表示,该模型基于 Qwen2.532B-Base 构建,通过将研究流程收敛为单一智能体的决策路径,显著降低推理成本。

为让 AI 具备接近人类专家的研究能力,Step-DeepResearch重点打磨了四项“原子能力”:规划与任务拆解、深入信息获取、反思与验证,以及专业报告生成。训练阶段,团队借助高质量技术报告、财务文件与知识图谱数据,搭建了大规模合成数据管线,使其在处理长程项目时保持极高的稳定性。

目前,该模型在 Scale AI 的研究评测中取得 61.42% 的依从率,表现可与 OpenAI 和 Google 的同类深度研究系统相媲美。而在阶跃星辰自研的 ADR-Bench 中文基准测试中,这款 32B 模型甚至超过了部分更大规模的开源模型,展现出极高的实用价值与成本优势。

论文:https://arxiv.org/pdf/2512.20491

划重点:

  • 🧠 单智能体架构:Step-DeepResearch把规划、检索、校验与写作内化为同一模型的原子能力,无需调用多个外部智能体,效率更高、成本更低。

  • 📚 深度科研导向:不止于简单的问答检索,模型支持长达 128k 的上下文,可从 2000 万+ 论文与权威索引中获取信息,生成严谨的结构化报告。

  • 🏆 性能表现强劲:在多项深度研究评测中发挥出色,32B 规模即可达到可比肩大参数闭源模型的专业研究水准。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享