智谱 GLM-5 疑似“泄露”?沿用 DeepSeek 架构性能猛增,股价飙升 200% 稳居国产 AI 头部

2026 年春节档,国产大模型连出重磅。继 DeepSeek 成为现象级产品后,智谱 AI 的新一代大模型 GLM-5 也正式露面。消息一出,资本市场迅速升温,智谱股价近期大涨 200%,总市值冲至 1500 亿港币,约为 IPO 时的 3 倍。

image.png

马甲现形:匿名模型“Pony Alpha”实为 GLM-5

近日,全球模型服务平台 OpenRouter 上线了一款代号为 “Pony Alpha” 的匿名模型,因其代码生成能力接近 Claude Opus,引发全球热议。

  • 身份线索:系统提示词显示其来自 GLM 系列。

  • “指纹”检验:网友通过 GLM 家族特有的逻辑 Bug 进行验证(如输入“锅内倒入植物油烧热”会出现特定异常回复),基本坐实其归属。

image.png

核心技术:沿用 DeepSeek 架构,参数加倍

GLM-5 在技术路线中选择与DeepSeek-V3相同的稀疏注意力架构(DSA),被认为是性价比很高的升级策略。

  • 规模跨越:总参数量达 745B,相较前代 GLM-4.7 提升一倍。

  • 计算效率:包含 256 个专家,每次激活 8 个(约 44B 激活参数),稀疏度约为 5.9%。

  • 长文本与多模态:支持最高 202K token 的上下文窗口;同时面向 2026 年的需求,GLM-5 强化了视频理解等多模态能力,补上此前DeepSeek纯文本架构的短板。

行业影响:部署门槛进一步降低

得益于 DSA 架构,GLM-5 可直接复用 vLLM、SGLang 等主流推理框架的现有优化,这意味着企业在部署时的技术门槛与算力成本都会明显下降。

在国产 AI “偷家”海外大模型的趋势中,智谱凭借 GLM-5 的强劲表现,再次证明了其在模型性能与工程实现上的顶尖实力。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享