这一模型专为长程任务打造。

智东西4月8日报道,今天,智谱正式开源其最强模型GLM-5.1,这一模型在专业软件开发基准测试SWE-Bench Pro中,GLM-5.1刷新全球最佳成绩,得分达到58.4,超过了GPT-5.4、Claude Opus 4.6等已经正式发布的闭源模型,和MiniMax M2.7、Kimi K2.5等开源模型。

GLM-5.1并非只能跑跑简单的Vibe Coding小案例,它专门面向长程任务设计,能持续地自主规划、执行并迭代,最终交付完整的工程结果。

两个官方演示,直接把“长程任务”的能力具象化了:

在向量数据库的调优任务中,GLM-5.1没有人类手把手教,自己跑了655轮迭代——测试、分析、改代码、再测试……最终把性能硬生生提升至3.6倍。

本文转自:凤凰网科技

原文地址: https://tech.ifeng.com/c/8s9SbpibxmB