通义实验室联合开源统一科学大模型 LOGOS,1B 参数表现超过 NatureLM

通义实验室在2026年6月18日正式宣布,开源首个建立在统一“科学语法”之上的多领域科学生成基础模型 LOGOS(Language Of Generative Objects in Science)。

这款模型由 ATH-Token Foundry 携手中国人民大学高瓴人工智能学院共同打造,目标是改变传统 AI for Science(AI4S)领域“一个任务配一个专家模型”的割裂局面。它把蛋白质、小分子、材料以及化学反应等不同类型的科学对象,统一编码成离散 Token 序列,从而实现跨领域知识融合,并在原生大模型框架下完成自回归生成。

QQ20260618-105452.jpg

LOGOS 的关键创新,在于其提出了全新的“科学语法”设计以及空间交互离散化方法。借助这一方案,模型不必依赖稀缺的 3D 坐标数据和专门的几何网络,只通过序列预测,就能深入理解复杂的 3D 空间相互作用规律,同时让预训练和下游任务在形式与目标上保持完全一致。

从评测结果来看,参数规模仅为 1B 的 LOGOS-1B,在口袋条件配体生成、逆合成预测(Top-1 准确率达到 74.8%)、口袋位点识别(HOLO4K 数据集 Top-n 准确率达到 58.5%)以及 MOF 材料生成(新型构建单元比例提升 76%)等六项代表性任务中,整体都做到了与领域专用方法持平甚至超越。更值得关注的是,它还以仅为对方 1/56 的参数量,在多个任务上超过了 8×7B 的 NatureLM。

QQ20260618-105459.jpg

由于继承了大语言模型(LLM)的预训练权重,LOGOS 不但可以直接沿用 vLLM 推理加速、模型量化等成熟工程能力,还进一步打通了不同学科之间的界限,推动自然科学研究从“筛选已知”迈向“设计驱动”。目前,这一模型的权重、推理代码和技术报告都已经面向全球开源。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享