GLM-4.7 - 智谱推出的旗舰AI模型,Coding能力再提升
GLM-4.7是什么
GLM-4.7是智谱AI发布的一款开源模型,其核心升级聚焦于编码、推理与工具协同三大能力。该模型在多语言编程、复杂任务规划及前端设计美学方面表现卓越,并对包括Claude Code在内的主流编程框架提供了深度支持。基准测试数据表明,其代码能力稳居开源模型领先梯队,推理能力实现了显著跃升。为实现更稳定的复杂任务执行,模型内部集成了交错式、保留式及轮级思考等多种高级模式,大幅提升了任务执行的可控性。开发者现可通过BigModel平台获取其API服务,同时,z.ai全栈开发模式中全新的Skills模块也已上线,旨在为开发者提供更高效、更智能的编程体验。
GLM-4.7的主要功能
- 核心编码能力:GLM-4.7在多语言编程与终端任务处理方面表现卓越。其支持的“先思考、再行动”模式,有效提升了复杂任务的执行稳定性与最终代码的产出质量。
- 前端设计优化:该功能对有UI设计需求的开发者极为实用。模型能够生成具备现代感与美学设计的网页及幻灯片,直接提升设计产出质量,帮助开发者节省大量繁琐的样式调整时间。
- 工具调用能力:在工具调用与网页浏览等实际任务中,其效率与准确性均有显著提升。例如,在τ²-Bench测试中获得87.4%的高分,在BrowseComp测试中取得67.5分,提升幅度可观。
- 复杂推理能力:数学与逻辑推理是衡量模型硬实力的关键。GLM-4.7在HLE等高难度基准测试中得分达42.8%,较前代大幅提升12.4%,处理复杂问题的能力已实现质的飞跃。
- 思考模式优化:针对长程任务易“跑偏”或“遗忘”的痛点,模型引入了交错式、保留式及轮级思考模式。这相当于为模型的思考过程配备了“导航”与“记事本”,从而在执行复杂任务时具备更强的稳定性与可控性。
- 多模态与全栈开发:模型并非孤立增强单项能力,而是着眼于多模态任务的协同与全栈开发的闭环。集成Skills模块的设计,正是为了赋能开发者构建交互更丰富、体验更流畅的完整应用。
GLM-4.7的性能表现
- 编码能力(Core Coding):
- SWE-bench Verified:得分73.8%,较GLM-4.6提升5.8个百分点,达到开源模型的顶尖(SOTA)水平。
- SWE-bench Multilingual:得分66.7%,相比前代跃升12.9个百分点,清晰印证了其多语言编程能力的显著增强。
- Terminal Bench 2.0:得分41%,提升幅度高达16.5个百分点,终端任务性能实现了跨越式进步。
- 工具调用能力(Tool Using):
- τ²-Bench:取得87.4%的高分,较前代提升12.2个百分点,其交互式工具调用能力同样位居开源SOTA行列。
- BrowseComp(网页浏览):基础版本得分52.0%,提升6.9个百分点;启用先进的上下文管理机制后,得分飙升至67.5%,提升达10个百分点。这组数据充分说明了其在网页浏览与复杂工具链管理方面的优化成效。
- 复杂推理能力(Complex Reasoning):
- HLE(人类最后的考试):得分42.8%,相比GLM-4.6实现12.4个百分点的巨大跨越,数学与深度推理能力的进步一目了然。
- MMLU-Pro:得分84.3%,保持稳定提升,表明其多领域综合推理能力基础扎实。
- GPQA-Diamond:得分85.7%,相比前代提升4.7个百分点,推理的精准度得到了进一步锤炼。
GLM-4.7的项目地址
- 项目官网:https://z.ai/blog/glm-4.7,获取最权威的发布信息和详情解读。
- GitHub仓库:https://github.com/zai-org/GLM-4.5,开发者可以在此跟进代码、参与讨论。
- HuggingFace模型库:https://huggingface.co/zai-org/GLM-4.7,方便社区直接下载和使用模型。
GLM-4.7的应用场景
- 编程与软件开发:作为高效的智能编程助手,它能生成高质量的多语言代码片段乃至完整模块,切实提升开发效率,降低重复性劳动。
- 前端开发与设计:对于前端开发者和UI/UX设计师,它可以快速生成现代、美观的页面布局与配色方案,将从业者从繁复的样式调整中解放出来,更专注于核心逻辑与用户体验。
- 复杂任务规划与执行:凭借其保留式思考和轮级思考等高级模式,GLM-4.7擅长拆解和执行多步骤的复杂任务,确保长链条工作的准确性与稳定性,在自动化流程设计中价值凸显。
- 教育与学习:在编程教育领域,它可以提供丰富的代码示例和实时练习指导;同时,通过解答数学和逻辑难题,也能有效辅助学生锻炼和提升结构化思维能力。
- 办公自动化:从自动生成格式规范的文档、报告,到编写数据分析脚本,GLM-4.7都能高效应用,大幅减少人工编写与排版的时间,成为提升办公效率的智能副手。