全球权威AI评测平台LMArena更新代码专项榜单,GLM-5.1模型荣登全球开源模型榜首,并位列全球所有模型第三名。
该模型在继承强大开源编码能力的基础上,于长程任务上取得关键进展:
- 8小时从零构建Linux桌面系统
- 655次迭代突破向量数据库优化瓶颈
- 1000轮工具调用优化真实机器学习模型负载
在同等评估标准下,GLM-5.1是唯一能达到8小时级持续工作的开源模型,全球范围内仅有Claude Opus 4.6等极少数模型具备此能力。
全球权威AI评测平台LMArena更新代码专项榜单,GLM-5.1模型荣登全球开源模型榜首,并位列全球所有模型第三名。
该模型在继承强大开源编码能力的基础上,于长程任务上取得关键进展:
在同等评估标准下,GLM-5.1是唯一能达到8小时级持续工作的开源模型,全球范围内仅有Claude Opus 4.6等极少数模型具备此能力。