大模型迎来“8小时班次”! 智谱 GLM-5.1 上线:长程任务实力首度跑赢 Opus 4.6

4月10日,智谱发布并开源了新一代旗舰模型 GLM-5.1。这一次最大的亮点,是其对长程任务(Long-Horizon Task)的处理能力跃升,成为全球首个能做到“连续工作8小时”的开源模型。

image.png

核心升级:从“问答式”走向“自驱办公”

智谱团队表示,评判下一代大模型的关键标准,不再是分数榜单,而是“能独立干活多久”:

  • 8小时连续作业:GLM-5.1可在一项任务里自主、稳态运行超过8小时。期间可自行规划与执行、识别瓶颈并自我改进,最终交付工程级成果。

  • 代码能力登顶:在面向专业软件开发的 SWE-bench Pro 基准上,GLM-5.1实现国产模型对海外顶尖模型Opus4.6首次超越。

  • 实测表现亮眼:在针对海量数据检索系统的编程实测中,GLM-5.1经超过6000次迭代优化,最终运行速度达此前最好成绩的6倍。

image.png

行业走向:摆脱“低价赛”,走向“性能溢价”

随着性能跨越式提升,智谱也同步调整了定价策略:

  • 价格对齐海外:GLM-5.1平台价格再上调10%。在编码场景中,定价已首次与海外头部厂商Anthropic看齐。

  • 回归价值定价:智谱 CEO 张鹏称,长期打低价不利于行业健康,调价是为将 AI 价值拉回合理区间。目前智谱已在全球实现规模化变现,API 业务 ARR(年度经常性收入)同比提升达60倍。

市场趋势:算力与模型共同进入“涨价期”

2026年开年起,国内 AI 行业整体正由“低价换量”转向“价值定价”:

  • 腾讯云:宣布 AI 算力与容器等相关产品统一上调5%。

  • 阿里云:AI 算力类产品价格上涨区间为5%-34%。

  • 百度智能云:相关 AI 算力服务上调5%-30%。

结语:AGI 的“时间刻度”

业内普遍认为,衡量 AGI 的关键之一是完成复杂任务所需时间。前沿模型独立完成任务的时长,正以约每7个月翻倍的速度在演进。随着GLM-5.1开启“8小时工作模式”,大模型正从“随问随答”的聊天工具,迈向可深度参与复杂工程的“虚拟同事”。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享