找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1865

积分

0

好友

246

主题
发表于 2025-12-24 16:05:21 | 查看: 36| 回复: 0

图片

智谱AI正式发布并开源了新一代大模型GLM-4.7。此次更新主要聚焦于编程与代理式任务能力的提升,同时在推理等方面也进行了增强。

image

当前,大模型领域的竞争焦点已从基础问答转向实际任务执行能力。相应的评测体系也日益关注真实场景,如代码修改、终端操作、多工具调用及长链路任务执行等。为全面评估GLM-4.7,智谱将其投入了17项基准测试,与GPT-5、Claude Sonnet 4.5、Gemini 3.0 Pro等顶尖模型同台竞技。

结果显示,GLM-4.7在两项关键评测中刷新了公开SOTA记录:在测试高级数学推理能力的AIME 2025中,正确率达到95.7%;在BrowseComp-ZH中获得66.6分。更引人注目的是,其在编程专项测试中表现卓越,在SWE-bench-Verified上得分73.8%,在LiveCodeBench V6上得分84.9%,这两项成绩均超过了Claude Sonnet 4.5,创造了新的开源模型SOTA。

image

image

从BenchMark到实际案例:UI生成质量飞跃

除了基准测试的高分,官方展示的实际应用案例更能体现GLM-4.7的实用价值。

前端开发场景中,GLM-4.7生成普通HTML网页的效率和效果显著提升。与上一代模型相比,其生成的代码布局结构更清晰,组件风格统一,且能更好地理解并实现多种设计风格(从简约到复古)。对于需要前端框架/工程化知识的交互式Web体验页面,GLM-4.7也能高质量完成。

例如,使用同一段提示词分别生成交互页面,GLM-4.7的作品在动态效果和3D交互感上明显更强。

image
GLM-4.6生成效果
图片

GLM-4.7生成效果
image

GLM-4.7的“高级审美”能力在生成3D艺术作品时尤为突出。它在空间层次、透视关系、配色与材质对比上处理得当。例如,在生成“一座被樱花环绕的华丽宝塔”花园场景时,其作品兼具3D体积感和和谐美观的视觉效果。

图片

在日常办公场景中,GLM-4.7的幻灯片制作能力也有质的提升。其生成的PPT页面在16:9比例上的适配率从52%大幅提升至91%,布局更准确、元素比例更舒适,整体观感接近可直接使用的成品。同样,在海报设计上,其排版与配色也显得更加灵活和专业。

技术核心:GLM-4.7的三种“思考模式”

GLM-4.7的性能提升,源于其对复杂任务中推理与行动机制的系统性重构。模型整合了一套由三种模式组成的推理机制,旨在使思考过程更稳定、连贯。

  1. 交织式思考:模型在每次生成回复或调用工具前,都会先进行内部推理,再决定下一步行动。这提升了指令遵循的准确性和输出质量。
  2. 保留式思考:在编码代理等多轮长链路任务中,模型能自动保留并重用历史对话中的思维模块,避免信息丢失和不一致,减少重复推理。
  3. 轮级思考:支持在会话中按回合粒度控制是否启用推理。对于简单请求可关闭以降低延迟,对复杂任务则开启完整推理流程,实现性能与效果的平衡。

image

这套组合机制为GLM-4.7在代理式编程和长周期任务中提供了关键技术基础,使其行为更加稳定可控。这也标志着人工智能模型在复杂任务规划和执行方面取得了重要进展。

智谱AI背景与模型开源

智谱AI成立于2019年,脱胎于清华大学知识工程实验室(KEG)。公司持续投入研发,其GLM系列大模型已支持约8000万台设备,服务超过1.2万家机构客户。近期,智谱已正式向港交所递交招股书,进入上市冲刺阶段。

GLM-4.7开源链接:




上一篇:Java GC优化实战:高并发下将停顿从200ms降至20ms
下一篇:C++编程实战:统计区间内数字出现频次的两种算法
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-1-11 02:31 , Processed in 0.210202 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 云栈社区.

快速回复 返回顶部 返回列表