GLM-4.5 vs GLM-4.7 vs GLM-5 全方位技术演进对比-尧图手机网站定制

从 2025 年 7 月到 2026 年 2 月，智谱 AI 在短短 7 个月内连续推出 GLM-4.5、GLM-4.7 和 GLM-5 三代旗舰模型。这不是简单的版本号递增，而是一条清晰的技术演进路线：从统一推理/编码/Agent 能力（ARC）→ 强化 Agentic Coding → 全面迈向 Agentic Engineering。本文将从架构设计、训练策略、基准性能和部署生态四大维度，深度对比三代模型的核心差异与演进脉络。一、发布时间线与核心定位维度GLM-4.5GLM-4.7GLM-5发布时间2025 年 7 月2025 年 12 月2026 年 2 月核心定位ARC（Agentic + Reasoning + Coding）统一基座Agentic Coding 实战强化Agentic Engineering 范式跃迁开源协议MITMITMIT技术报告arXiv:2508.06471基于 GLM-4.5 报告 + 技术博客arXiv:2602.15763代号/彩蛋——“Pony Alpha”（匿名测试）三代模型的定位层层递进：GLM-4.5解决的是"能不能"的问题——首次在单一模型中统一推理、编码和 Agent 三大能力GLM-4.7解决的是"好不好"的问题——聚焦编码场景的实战打磨，让模型真正"能用"GLM-5解决的是"强不强"的问题——从写代码到写工程，实现完整的系统级工程能力二、模型架构：从 GQA 到 MLA，从标准 MoE 到 DSA2.1 核心参数对比架构维度GLM-4.5GLM-4.7GLM-5总参数量355B358B744B激活参数量32B~32B40B层数92 层（前 3 层 Dense，后 89 层 MoE）~92 层80 层专家数量160（每层激活 8 个）~160256（每层激活 8 个）隐藏维度5120~5120扩展注意力头数96（GQA, 8 组）96调整（MLA）注意力机制GQA（分组查询注意力）GQA → MLA 过渡MLA + DSA位置编码Partial RoPE (base 1M)RoPERoPE上下文长度128K200K200K最大输出长度—128K128KMTP 层1 层1 层3 层（参数共享）2.2 三代注意力机制的演进这是三代模型最核心的架构差异之一：GLM-4.5：GQA（Grouped-Query Attention）采用 96 个注意力头、8 个查询组的 GQA 设计引入 QK-Norm 稳定注意力计算注意力头数是同规模隐藏维度下的 ~2.5 倍，团队发现虽然训练 loss 没有下降，但推理基准表现一致性提升优势：成熟稳定，推理效率适中GLM-4.7：GQA → MLA 过渡Flash 版本已使用 MLA（Multi-head Latent Attention），实现 8× KV Cache 压缩旗舰版在 GQA 基础上引入了更长上下文（200K）的优化过渡阶段，为 GLM-5 的全面 MLA 铺路GLM-5：MLA + DSA（DeepSeek Sparse Attention）全面采用 MLA，通过低维潜变量压缩 KV Cache提出Muon Split方法解决 MLA + Muon 优化器的兼容性问题：将上投影矩阵拆分为每个注意力头独立的小矩阵，允许不同头以不同速率更新注意力头维度从 192 增大到 256（MLA-256 变体），减少 1/3 注意力头数，降低解码阶段计算量引入DSA 稀疏注意力：动态根据 token 重要性分配注意力资源，将长序列注意力计算降低约 1.5–2 倍GLM-4.5: GQA (96 heads, 8 groups) → 标准全注意力 ↓ GLM-4.7: GQA + MLA(Flash版) → 200K 上下文，KV Cache 8× 压缩 ↓ GLM-5: MLA-256 + DSA → 稀疏动态注意力，长序列成本减半2.3 MoE 架构的演进维度GLM-4.5GLM-4.7GLM-5路由方式Sigmoid 门控 + 无损平衡路由继承 GLM-4.5优化路由共享专家有（专用共享专家 + 重叠机制）继承增强设计理念“更深而非更宽”沿袭 4.5更多专家 + 更少层数激活比例~1/11 (32B/355B)~1/11~1/18.6 (40B/744B)GLM-5 的 MoE 架构做了一个关键权衡：将专家数量从 160 扩展到 256，同时将层数从 92 减少到 80。这是为了减少专家并行通信的开销——更多的专家意味着更高的模型容量，而更少的层数减少了跨设备通信的次数。2.4 多 Token 预测（MTP）的进化维度GLM-4.5GLM-4.7GLM-5MTP 层数113（参数共享）损失系数0.3 → 0.1继承优化推测解码支持支持接受长度更优GLM-5 的 MTP 创新在于：训练时共享 3 个 MTP 层的参数，推理时复用同一组参数进行多步推测。这在保持内存成本不变的情况下，显著提升了推测解码的接受率——实测比 DeepSeek-V3.2 在相同推测步数下接受更多 t

2024ICPC 香港区域赛 K题 LR String

题目链接 https://qoj.ac/contest/1885/problem/9925?v1 题目描述给你一个字符串s，仅有L和R组成，可以进行两个操作任意遍： 1 将L左边的字符删除。 2 将R左边的字符删除。现在给你q个字符串，对于每个字符串t，是否可以…

2026/7/3 20:27:28 阅读更多 →

跨境卖家如何用售后数据看清真实产品缺陷

在跨境电商的竞技场上，许多卖家将大量精力倾注于流量获取与营销推广，却往往忽视了售后环节中潜藏的巨大价值。当一件商品漂洋过海抵达消费者手中，交易并未真正结束，而是开启了一段更为关键的“真相时刻”。退货、投诉、差评、客服…

2026/5/17 10:23:51 阅读更多 →

2026 年权威榜单：GEO 优化服务商 TOP5 综合实力全景测评

2026 年，DeepSeek、豆包、Kimi 等主流 AI 大模型全面融入大众生活，中国网民的消费决策路径迎来第三次重要转变，超过半数用户习惯借助 AI 问答完成选购咨询与品牌对比，“答案即流量” 成为全新行业规则。生成式引擎优化&#xff08…

2026/7/4 8:16:54 阅读更多 →

怎样轻松实现图像隐写分析：StegOnline开源工具的实战指南

怎样轻松实现图像隐写分析：StegOnline开源工具的实战指南【免费下载链接】StegOnline A web-based, accessible and open-source port of StegSolve. 项目地址: https://gitcode.com/gh_mirrors/st/StegOnline 图像隐写技术是信息安全领域的重要分支&#x…

2026/7/5 1:02:06 阅读更多 →

AI 辅助特征工程：别让模型把脏字段包装成高价值特征

AI 辅助特征工程：别让模型把脏字段包装成高价值特征一、自动特征工程也需要治理机器学习项目里，AI 可以帮助生成特征候选、解释字段含义、发现组合变量。效率确实高了，但风险也变大：如果源字段质量差、口径不稳定、存在数据泄露…

2026/7/5 1:02:06 阅读更多 →

网络安全渗透测试入门：从DVWA到在线靶场的实战训练指南

1. 靶场入门：为什么说它是渗透测试的“新手村”与“演武场”如果你刚接触网络安全，对“渗透测试”这个词既感到兴奋又有些迷茫，不知道从哪里开始动手，那么“靶场”就是你绕不开的第一个关键节点。你可以把它理解为一个完全合法、安…

2026/7/5 0:56:03 阅读更多 →

【大白话说Java面试题第154题】【06_Spring篇】第14题：Spring 支持的 Bean 作用域

📌 PDF：大白话说Java面试题 — 06_Spring篇第14题：Spring 支持的 Bean 作用域 📚 回答： 核心考点： Spring Bean 作用域是 Spring IoC 容器的核心设计之一，大厂面试不会只问"有哪几种&qu…

2026/7/5 0:56:03 阅读更多 →

跨线程大数据的免拷贝黑科技：拆解 Qt 内存管理与“非 const 性能刺客”

在构建高性能系统（如局域网分布式总线、实时语音转文字终端、或本地 AI 模型中转网关）时，我们经常需要在不同的线程之间频繁流转海量的原始字节数据（如 QByteArray）。许多初学者、甚至有经验的 C 开发者在刚接触 Qt 多…

2026/7/5 0:54:02 阅读更多 →

FModel：Unreal Engine游戏档案浏览器完整指南

FModel：Unreal Engine游戏档案浏览器完整指南【免费下载链接】FModel Unreal Engine Archives Explorer 项目地址: https://gitcode.com/gh_mirrors/fm/FModel FModel是一款基于C#开发的Unreal Engine档案浏览器，专为游戏开发者和逆向工程师设计…

2026/7/5 0:54:02 阅读更多 →

日新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱，支持下载视频、番剧等等各类资源项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

威胁模型的陌生现状在忙碌疲惫的一天里，参与了关于混合后量子密码学的讨论，应付端点攻击找茬的人，还参与留言板讨论后，发现“威胁模型”对多数人仍是陌生概念，且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →

渗透测试入门指南：从零基础到实战环境搭建

1. 从“看热闹”到“入门”：我理解的渗透测试到底是什么？每次看到新闻里说某个大公司的数据被“黑”了，或者某个网站被攻击导致服务瘫痪，你是不是和我一样，心里会冒出两个念头：一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

2026/7/5 0:03:34 阅读更多 →

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

2026/7/5 0:03:34 阅读更多 →

渗透测试入门指南：从零基础到实战环境搭建

2026/7/5 0:07:38 阅读更多 →

GLM-4.5 vs GLM-4.7 vs GLM-5 全方位技术演进对比

相关新闻

2024ICPC 香港区域赛 K题 LR String

跨境卖家如何用售后数据看清真实产品缺陷

2026 年权威榜单：GEO 优化服务商 TOP5 综合实力全景测评

最新新闻

怎样轻松实现图像隐写分析：StegOnline开源工具的实战指南

AI 辅助特征工程：别让模型把脏字段包装成高价值特征

网络安全渗透测试入门：从DVWA到在线靶场的实战训练指南

【大白话说Java面试题第154题】【06_Spring篇】第14题：Spring 支持的 Bean 作用域

跨线程大数据的免拷贝黑科技：拆解 Qt 内存管理与“非 const 性能刺客”

FModel：Unreal Engine游戏档案浏览器完整指南

日新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

渗透测试入门指南：从零基础到实战环境搭建

周新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

渗透测试入门指南：从零基础到实战环境搭建

月新闻

GLM-4.5 vs GLM-4.7 vs GLM-5 全方位技术演进对比

相关新闻

2024ICPC 香港区域赛 K题 LR String

跨境卖家如何用售后数据看清真实产品缺陷

2026 年权威榜单：GEO 优化服务商 TOP5 综合实力全景测评

最新新闻

怎样轻松实现图像隐写分析：StegOnline开源工具的实战指南

AI 辅助特征工程：别让模型把脏字段包装成高价值特征

网络安全渗透测试入门：从DVWA到在线靶场的实战训练指南

【大白话说Java面试题 第154题】【06_Spring篇】第14题：Spring 支持的 Bean 作用域

跨线程大数据的免拷贝黑科技：拆解 Qt 内存管理与“非 const 性能刺客”

FModel：Unreal Engine游戏档案浏览器完整指南

日新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

渗透测试入门指南：从零基础到实战环境搭建

周新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

渗透测试入门指南：从零基础到实战环境搭建

月新闻

【大白话说Java面试题第154题】【06_Spring篇】第14题：Spring 支持的 Bean 作用域