智谱GLM-4.7:代码能力全面进阶

AI寒武纪,2025-12-23 23:51:43

智谱发布 GLM-4.7 ,主要提升了代码能力

核心代码能力 :

相比前代 GLM-4.6,GLM-4.7 在多语言智能体(Agentic)编程和基于终端的任务上带来了显著提升,包括在 SWE-bench 上达到 73.8%(提升 5.8%),在 SWE-bench Multilingual 上达到 66.7%(提升 12.9%),以及在 Terminal Bench 2.0 上达到 41%(提升 16.5%)。GLM-4.7 还支持“谋定而后动”(行动前思考),在 Claude Code、Kilo Code、Cline 和 Roo Code 等主流智能体框架的复杂任务中表现出显著改进

Vibe coding :

GLM-4.7 在 UI 质量上迈出了一大步。它能编写出更简洁、更现代的网页,并能生成布局与尺寸更精准、外观更出色的幻灯片

工具使用 (Tool Using):

GLM-4.7 在工具使用方面实现了显著改进。在 τ2τ2-Bench 等基准测试以及通过BrowseComp 进行的网络浏览任务中,均可见明显的性能表现提升

复杂推理 :

GLM-4.7 大幅增强了数学和推理能力,在 HLE(人类终极考试,Humanity’s Last Exam)基准测试中得分达到 42.8%,相比 GLM-4.6 提升了 12.4%