在最新亮相的 GLM-5.1 中,这款开源模型展现出不俗的智能水平,能够在长达 8 小时的任务中自主推进,胜任复杂的工程项目。与过去只能短时交互的模型相比,GLM-5.1 在编程能力与长程执行方面都有明显提升。

这款模型在全球开源领域表现突出,在多项代码评测基准上交出优异答卷。在 SWE-Bench Pro 基准测试中,GLM-5.1 能准确定位并修复高难度工程 Bug,超越了部分顶级模型,如 GPT-5.4 与 Claude Opus4.6,展现出专业软件开发方面的硬实力。
GLM-5.1 的工作方式颇具看点:它可在夜间构建完整的 Linux 桌面系统,持续 8 小时执行超过 1200 步,并在约 20 分钟时交付首个可用成果。最终交付的系统功能完备,相当于四名开发者一周的工作量。同时,它在向量数据库优化与真实机器学习负载上的自我进化能力同样亮眼,进一步释放了 AI 在工程场景中的潜力。

这款模型的最大亮点,是能自我评估并持续优化。面对复杂任务时,GLM-5.1 不仅能识别问题、提出解决方案,还会主动调整策略,追求最佳结果。这种能力为 AI 的实际落地提供了新的思路。
GLM-5.1 的发布意味着一个新阶段的开启。开发者只需下达指令,就能期待它长时间稳定而高效地完成工作。
- GitHub:https://github.com/zai-org/GLM-5
- Hugging Face:https://huggingface.co/zai-org/GLM-5.1
- ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5.1
划重点:
🌟 GLM-5.1 可在 8 小时窗口内自主推进复杂任务,编码能力进一步增强。
💻 在多项代码评测中成绩亮眼,表现超越不少顶尖模型。
🔧 具备自检与自优化能力,展现了 AI 在工程实践中的广泛应用潜力。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?