2 月 4 日,上海 AI 实验室官宣面向科学的多模态模型——“书生 Intern-S1-Pro”,被称为全球开源社区参数体量最大的同类模型。该里程碑式模型建立在“通专融合”技术架构 SAGE 上,整体参数规模高达一万亿,在开源领域十分引人注目。
“书生 Intern-S1-Pro”的核心科研能力处于国际前列,尤其在高难度综合学科测试中展现出出色的逻辑推理水平,表现接近奥林匹克竞赛金牌选手。与此同时,它在真实科研流程中的智能体(Agent)能力也进入开源模型的第一梯队,为科研人员提供更强有力的支持。
该模型采用 MoE(混合专家)架构,配备 512 位专家,每次推理只激活 8 位专家,活跃参数约 22 亿。这样的设计既提升了计算效率,又显著降低了资源占用。在底层上,“书生 Intern-S1-Pro”带来两大突破:一是引入傅里叶位置编码与重构式时序编码器,形成从微观生命信号到宏观宇宙波动的“物理直觉”,理解能力更进一步;二是使用高效路由策略,缓解万亿参数训练中的稳定性和算力效率瓶颈,为超大规模模型训练夯实基础。
值得关注的是,“书生 Intern-S1-Pro”不只是一项学术成果,也为未来构建开放共享的 AGI4S(人工智能为科学)基础设施铺路。依托自研的模型架构与算力技术,上海 AI 实验室展现了中国在人工智能领域的实力与潜能。
为便于更多用户体验这款先进模型,上海 AI 实验室提供了在线体验入口和开源仓库地址,便于开发者与研究者继续探索。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?