阶跃星辰(Stepfun)近日正式发布了其全新一代开源基座模型——Step3.5Flash。这款模型专为智能体(Agent)场景打造,凭借强劲的推理能力与极速响应,旨在为开发者提供一个更聪明、更稳定、且成本可控的“Agent 大脑”。

作为一款高度聚焦的轻量模型,Step3.5Flash 在多个方面带来突破:
-
极快速度: 推理速度峰值可达 350 TPS(每秒生成的词数),在代码相关任务中表现格外亮眼。
-
性能比肩闭源: 在 Agent 核心应用场景与数学逻辑任务中,表现可与主流闭源大模型相媲美。
-
长链条任务保障: 稳定支持复杂的长逻辑链任务,可高效处理 256K 的超长上下文。
技术架构:效率与深度兼顾
Step3.5Flash 采用先进的稀疏 MoE(混合专家)架构,总参数量达 1960 亿,但每个 Token 实际激活约 110 亿参数。为进一步提升效率,模型加入 MTP-3 技术,可一次预测 3 个 Token,整体吞吐显著提升。此外,借助滑动窗口与全局注意力的混合方案,模型能精准抓取长文本中的关键点,显著降低计算负担。
多场景实测:从编程到端云协同
在真实应用展示中,Step3.5Flash 能力多面:
-
智能编程: 仅凭一段文字描述,即可自动生成并输出基于 WebGL2.0 引擎的高性能可视化平台。
-
复杂计算: 在无需外部工具的情况下,快速完成等差数列求和、阶乘累加等较难的数学运算。
-
端云协同: 作为“云端大脑”,可将用户模糊需求(如对比各平台价格)拆解为明确的搜索与抓取子任务,极大简化本地执行端的复杂度,并保证结果更可靠。
目前,Step3.5Flash 已在多个主流平台全量上线,包括 GitHub、HuggingFace 与 OpenRouter。为降低本地部署门槛,阶跃星辰还针对个人工作站(如 NVIDIA DGX、Apple M4 Max 等)进行了性能优化。同时,公司已启动 Step4 模型的训练,邀请全球开发者共同参与,定义下一代 Agent 基础模型。
-
OpenRouter 限免中,0 成本升级你的 Agent: https://openrouter.ai/stepfun/step-3.5-flash
-
GitHub 下载快速部署,打造专属 Agent: https://github.com/stepfun-ai/Step-3.5-Flash/tree/main
-
HuggingFace 获取模型权重: https://huggingface.co/stepfun-ai/Step-3.5-Flash


















用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?