上海 AI 实验室推出科学多模态模型“书生 Intern-S1-Pro”

2 月 4 日,上海 AI 实验室官宣面向科学的多模态模型——“书生 Intern-S1-Pro”,被称为全球开源社区参数体量最大的同类模型。该里程碑式模型建立在“通专融合”技术架构 SAGE 上,整体参数规模高达一万亿,在开源领域十分引人注目。

“书生 Intern-S1-Pro”的核心科研能力处于国际前列,尤其在高难度综合学科测试中展现出出色的逻辑推理水平,表现接近奥林匹克竞赛金牌选手。与此同时,它在真实科研流程中的智能体(Agent)能力也进入开源模型的第一梯队,为科研人员提供更强有力的支持。

该模型采用 MoE(混合专家)架构,配备 512 位专家,每次推理只激活 8 位专家,活跃参数约 22 亿。这样的设计既提升了计算效率,又显著降低了资源占用。在底层上,“书生 Intern-S1-Pro”带来两大突破:一是引入傅里叶位置编码与重构式时序编码器,形成从微观生命信号到宏观宇宙波动的“物理直觉”,理解能力更进一步;二是使用高效路由策略,缓解万亿参数训练中的稳定性和算力效率瓶颈,为超大规模模型训练夯实基础。

值得关注的是,“书生 Intern-S1-Pro”不只是一项学术成果,也为未来构建开放共享的 AGI4S(人工智能为科学)基础设施铺路。依托自研的模型架构与算力技术,上海 AI 实验室展现了中国在人工智能领域的实力与潜能。

为便于更多用户体验这款先进模型,上海 AI 实验室提供了在线体验入口和开源仓库地址,便于开发者与研究者继续探索。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享