GLM-4.5 vs GLM-4.7 vs GLM-5 全方位技术演进对比
从 2025 年 7 月到 2026 年 2 月,智谱 AI 在短短 7 个月内连续推出 GLM-4.5、GLM-4.7 和 GLM-5 三代旗舰模型。这不是简单的版本号递增,而是一条清晰的技术演进路线:从统一推理/编码/Agent 能力(ARC)→ 强化 Agentic Coding → 全面迈向 Agentic Engineering。本文将从架构设计、训练策略、基准性能和部署生态四大维度,深度对比三代模型的核心差异与演进脉络。一、发布时间线与核心定位维度GLM-4.5GLM-4.7GLM-5发布时间2025 年 7 月2025 年 12 月2026 年 2 月核心定位ARC(Agentic + Reasoning + Coding)统一基座Agentic Coding 实战强化Agentic Engineering 范式跃迁开源协议MITMITMIT技术报告arXiv:2508.06471基于 GLM-4.5 报告 + 技术博客arXiv:2602.15763代号/彩蛋——“Pony Alpha”(匿名测试)三代模型的定位层层递进:GLM-4.5解决的是"能不能"的问题——首次在单一模型中统一推理、编码和 Agent 三大能力GLM-4.7解决的是"好不好"的问题——聚焦编码场景的实战打磨,让模型真正"能用"GLM-5解决的是"强不强"的问题——从写代码到写工程,实现完整的系统级工程能力二、模型架构:从 GQA 到 MLA,从标准 MoE 到 DSA2.1 核心参数对比架构维度GLM-4.5GLM-4.7GLM-5总参数量355B358B744B激活参数量32B~32B40B层数92 层(前 3 层 Dense,后 89 层 MoE)~92 层80 层专家数量160(每层激活 8 个)~160256(每层激活 8 个)隐藏维度5120~5120扩展注意力头数96(GQA, 8 组)96调整(MLA)注意力机制GQA(分组查询注意力)GQA → MLA 过渡MLA + DSA位置编码Partial RoPE (base 1M)RoPERoPE上下文长度128K200K200K最大输出长度—128K128KMTP 层1 层1 层3 层(参数共享)2.2 三代注意力机制的演进这是三代模型最核心的架构差异之一:GLM-4.5:GQA(Grouped-Query Attention)采用 96 个注意力头、8 个查询组的 GQA 设计引入 QK-Norm 稳定注意力计算注意力头数是同规模隐藏维度下的 ~2.5 倍,团队发现虽然训练 loss 没有下降,但推理基准表现一致性提升优势:成熟稳定,推理效率适中GLM-4.7:GQA → MLA 过渡Flash 版本已使用 MLA(Multi-head Latent Attention),实现 8× KV Cache 压缩旗舰版在 GQA 基础上引入了更长上下文(200K)的优化过渡阶段,为 GLM-5 的全面 MLA 铺路GLM-5:MLA + DSA(DeepSeek Sparse Attention)全面采用 MLA,通过低维潜变量压缩 KV Cache提出Muon Split方法解决 MLA + Muon 优化器的兼容性问题:将上投影矩阵拆分为每个注意力头独立的小矩阵,允许不同头以不同速率更新注意力头维度从 192 增大到 256(MLA-256 变体),减少 1/3 注意力头数,降低解码阶段计算量引入DSA 稀疏注意力:动态根据 token 重要性分配注意力资源,将长序列注意力计算降低约 1.5–2 倍GLM-4.5: GQA (96 heads, 8 groups) → 标准全注意力 ↓ GLM-4.7: GQA + MLA(Flash版) → 200K 上下文,KV Cache 8× 压缩 ↓ GLM-5: MLA-256 + DSA → 稀疏动态注意力,长序列成本减半2.3 MoE 架构的演进维度GLM-4.5GLM-4.7GLM-5路由方式Sigmoid 门控 + 无损平衡路由继承 GLM-4.5优化路由共享专家有(专用共享专家 + 重叠机制)继承增强设计理念“更深而非更宽”沿袭 4.5更多专家 + 更少层数激活比例~1/11 (32B/355B)~1/11~1/18.6 (40B/744B)GLM-5 的 MoE 架构做了一个关键权衡:将专家数量从 160 扩展到 256,同时将层数从 92 减少到 80。这是为了减少专家并行通信的开销——更多的专家意味着更高的模型容量,而更少的层数减少了跨设备通信的次数。2.4 多 Token 预测(MTP)的进化维度GLM-4.5GLM-4.7GLM-5MTP 层数113(参数共享)损失系数0.3 → 0.1继承优化推测解码支持支持接受长度更优GLM-5 的 MTP 创新在于:训练时共享 3 个 MTP 层的参数,推理时复用同一组参数进行多步推测。这在保持内存成本不变的情况下,显著提升了推测解码的接受率——实测比 DeepSeek-V3.2 在相同推测步数下接受更多 t

相关新闻

2024ICPC 香港区域赛 K题 LR String

2024ICPC 香港区域赛 K题 LR String

题目链接 https://qoj.ac/contest/1885/problem/9925?v1 题目描述 给你一个字符串s,仅有L和R组成,可以进行两个操作任意遍: 1 将L左边的字符删除。 2 将R左边的字符删除。 现在给你q个字符串,对于每个字符串t,是否可以…

2026/7/3 20:27:28 阅读更多 →
跨境卖家如何用售后数据看清真实产品缺陷

跨境卖家如何用售后数据看清真实产品缺陷

在跨境电商的竞技场上,许多卖家将大量精力倾注于流量获取与营销推广,却往往忽视了售后环节中潜藏的巨大价值。当一件商品漂洋过海抵达消费者手中,交易并未真正结束,而是开启了一段更为关键的“真相时刻”。退货、投诉、差评、客服…

2026/5/17 10:23:51 阅读更多 →
2026 年权威榜单:GEO 优化服务商 TOP5 综合实力全景测评

2026 年权威榜单:GEO 优化服务商 TOP5 综合实力全景测评

2026 年,DeepSeek、豆包、Kimi 等主流 AI 大模型全面融入大众生活,中国网民的消费决策路径迎来第三次重要转变,超过半数用户习惯借助 AI 问答完成选购咨询与品牌对比,“答案即流量” 成为全新行业规则。生成式引擎优化&#xff08…

2026/7/4 8:16:54 阅读更多 →

最新新闻

怎样轻松实现图像隐写分析:StegOnline开源工具的实战指南

怎样轻松实现图像隐写分析:StegOnline开源工具的实战指南

怎样轻松实现图像隐写分析:StegOnline开源工具的实战指南 【免费下载链接】StegOnline A web-based, accessible and open-source port of StegSolve. 项目地址: https://gitcode.com/gh_mirrors/st/StegOnline 图像隐写技术是信息安全领域的重要分支&#x…

2026/7/5 1:02:06 阅读更多 →
AI 辅助特征工程:别让模型把脏字段包装成高价值特征

AI 辅助特征工程:别让模型把脏字段包装成高价值特征

AI 辅助特征工程:别让模型把脏字段包装成高价值特征 一、自动特征工程也需要治理 机器学习项目里,AI 可以帮助生成特征候选、解释字段含义、发现组合变量。效率确实高了,但风险也变大:如果源字段质量差、口径不稳定、存在数据泄露…

2026/7/5 1:02:06 阅读更多 →
网络安全渗透测试入门:从DVWA到在线靶场的实战训练指南

网络安全渗透测试入门:从DVWA到在线靶场的实战训练指南

1. 靶场入门:为什么说它是渗透测试的“新手村”与“演武场”如果你刚接触网络安全,对“渗透测试”这个词既感到兴奋又有些迷茫,不知道从哪里开始动手,那么“靶场”就是你绕不开的第一个关键节点。你可以把它理解为一个完全合法、安…

2026/7/5 0:56:03 阅读更多 →
【大白话说Java面试题 第154题】【06_Spring篇】第14题:Spring 支持的 Bean 作用域

【大白话说Java面试题 第154题】【06_Spring篇】第14题:Spring 支持的 Bean 作用域

📌 PDF:大白话说Java面试题 — 06_Spring篇 第14题:Spring 支持的 Bean 作用域 📚 回答: 核心考点: Spring Bean 作用域是 Spring IoC 容器的核心设计之一,大厂面试不会只问"有哪几种&qu…

2026/7/5 0:56:03 阅读更多 →
跨线程大数据的免拷贝黑科技:拆解 Qt 内存管理与“非 const 性能刺客”

跨线程大数据的免拷贝黑科技:拆解 Qt 内存管理与“非 const 性能刺客”

在构建高性能系统(如局域网分布式总线、实时语音转文字终端、或本地 AI 模型中转网关)时,我们经常需要在不同的线程之间频繁流转海量的原始字节数据(如 QByteArray)。 许多初学者、甚至有经验的 C 开发者在刚接触 Qt 多…

2026/7/5 0:54:02 阅读更多 →
FModel:Unreal Engine游戏档案浏览器完整指南

FModel:Unreal Engine游戏档案浏览器完整指南

FModel:Unreal Engine游戏档案浏览器完整指南 【免费下载链接】FModel Unreal Engine Archives Explorer 项目地址: https://gitcode.com/gh_mirrors/fm/FModel FModel是一款基于C#开发的Unreal Engine档案浏览器,专为游戏开发者和逆向工程师设计…

2026/7/5 0:54:02 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻