正面硬刚Claude Opus 4.6：我们给GLM-5.1使了三个“绊子”，它居然…

这一模型专为长程任务打造。

智东西4月8日报道，今天，智谱正式开源其最强模型GLM-5.1，这一模型在专业软件开发基准测试SWE-Bench Pro中，GLM-5.1刷新全球最佳成绩，得分达到58.4，超过了GPT-5.4、Claude Opus 4.6等已经正式发布的闭源模型，和MiniMax M2.7、Kimi K2.5等开源模型。

GLM-5.1并非只能跑跑简单的Vibe Coding小案例，它专门面向长程任务设计，能持续地自主规划、执行并迭代，最终交付完整的工程结果。

两个官方演示，直接把“长程任务”的能力具象化了：

在向量数据库的调优任务中，GLM-5.1没有人类手把手教，自己跑了655轮迭代——测试、分析、改代码、再测试……最终把性能硬生生提升至3.6倍。

本文转自：凤凰网科技

原文地址： https://tech.ifeng.com/c/8s9SbpibxmB

正面硬刚Claude Opus 4.6：我们给GLM-5.1使了三个“绊子”，它居然…

分类推荐

相关内容

评论一下吧

搜索一下

每日一言

小同爱分享1 个月前

小同爱分享4 个月前

最新文章

阅读TOP榜

标签

链接

搜索

您还没有登录

正面硬刚Claude Opus 4.6：我们给GLM-5.1使了三个“绊子”，它居然…

分类推荐

相关内容

评论一下吧

搜索一下

每日一言

小同爱分享1 个月前

小同爱分享4 个月前

最新文章

阅读TOP榜

标签

链接

搜 索

感谢您的打赏

分享文章

搜索