近日,阶跃星辰(StepFun)发布了新一代深度研究智能体模型——

不同于市面上更偏向短问题检索优化的 Web Agent,
为让 AI 具备接近人类专家的研究能力,
目前,该模型在 Scale AI 的研究评测中取得 61.42% 的依从率,表现可与 OpenAI 和 Google 的同类深度研究系统相媲美。而在阶跃星辰自研的 ADR-Bench 中文基准测试中,这款 32B 模型甚至超过了部分更大规模的开源模型,展现出极高的实用价值与成本优势。
论文:https://arxiv.org/pdf/2512.20491
划重点:
-
🧠 单智能体架构:
把规划、检索、校验与写作内化为同一模型的原子能力,无需调用多个外部智能体,效率更高、成本更低。Step-DeepResearch -
📚 深度科研导向:不止于简单的问答检索,模型支持长达 128k 的上下文,可从 2000 万+ 论文与权威索引中获取信息,生成严谨的结构化报告。
-
🏆 性能表现强劲:在多项深度研究评测中发挥出色,32B 规模即可达到可比肩大参数闭源模型的专业研究水准。


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?