Day-0支持|摩尔线程MTT S5000率先完成对GLM-5的适配
2月11日智谱正式发布新一代大模型GLM-5。摩尔线程基于SGLang推理框架在旗舰级AI训推一体全功能GPU MTT S5000上Day-0完成了全流程适配与验证。凭借MUSA架构广泛的算子覆盖与强大的生态兼容能力摩尔线程成功打通了模型推理全链路并深度释放MTT S5000的原生FP8加速能力在确保模型精度的同时显著降低了显存占用实现了GLM-5的高性能推理。此次快速适配不仅印证了MUSA软件栈的成熟度更充分展现了国产全功能GPU对最新大模型即时、高效的支持能力。GLM-5与MTT S5000的国产双强联合将为开发者带来可对标国际顶尖模型的极致编程体验。无论是在函数补全、漏洞检测还是Debug场景中该组合均表现卓越以显著增强的逻辑规划能力从容应对各类复杂的长程任务挑战。GLM-5核心特性定义Agentic Engineering新高度作为GLM系列的最新里程碑版本GLM-5定位为当下顶尖的Coding模型整体性能较上一代提升20%。其核心突破在于Agentic Engineering代理工程能力——不仅具备深厚的代码功底更拥有处理复杂系统工程与长程Agent任务的实力能够实现从需求到应用的端到端开发。在全球权威的Artificial Analysis榜单中GLM-5位居全球第四、开源第一。GLM-5在编程能力上实现了对齐Claude Opus 4.5在业内公认的主流基准测试中取得开源模型SOTA。在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的开源模型最高分数性能超过 Gemini 3 Pro。在内部Claude Code评估集合中GLM-5在前端、后端、长程任务等编程开发任务上显著超越上一代的GLM-4.7平均增幅超过20%能够以极少的人工干预自主完成Agentic长程规划与执行、后端重构和深度调试等系统工程任务使用体感逼近Opus 4.5。摩尔线程核心优势软硬协同的全栈算力底座MTT S5000是专为大模型训练、推理及高性能计算而设计的全功能GPU智算卡基于第四代MUSA架构“平湖”打造。其单卡AI算力最高可达1000 TFLOPS配备80GB显存显存带宽达到1.6TB/s卡间互联带宽为784GB/s完整支持从FP8到FP64的全精度计算。依托MUSA全栈平台MTT S5000原生适配PyTorch、Megatron-LM、vLLM及SGLang等主流框架助力用户实现“零成本”代码迁移。无论是构建万卡级大规模训练集群还是部署高并发、低延迟的在线推理服务MTT S5000均展现出对标国际主流旗舰产品的卓越性能与稳定性旨在为行业筑牢坚实、易用的国产算力底座。MTT S5000官网地址https://www.mthreads.com/product/S5000。此次实现对GLM-5模型的快速支持正是摩尔线程基于MTT S5000构建的软硬协同技术能力的集中体现▼底层架构与生态兼容天生适配极速迁移针对GLM-5的长序列推理场景MTT S5000凭借充沛的算力储备与高计算密度结合对稀疏Attention的架构级支持在大规模上下文处理中依然保持高吞吐与低延迟。同时MUSA软件栈的敏捷性是实现Day-0适配的关键。基于MUSA架构的TileLang原生算子单元测试覆盖率已超过80%使得绝大多数通用算子可直接复用显著降低移植成本并能快速跟进前沿模型结构与新特性演进。▼原生FP8加速SGLang 框架深度优化基于高性能的SGLang-MUSA推理引擎及MTT S5000的硬件原生FP8计算单元摩尔线程实现了推理效率的跃升。与传统BF16相比原生FP8在保持GLM-5卓越的代码生成与逻辑推理能力精度无损的同时大幅降低了显存占用并显著提升了推理吞吐量为大规模部署提供了更高性价比的方案。▼独创ACE引擎通信计算并行释放极致吞吐针对大模型分布式推理中的通信痛点MTT S5000利用独创的异步通信引擎ACE将复杂的通信任务从计算核心中卸载实现了物理级的“通信计算重叠”。这一机制有效释放15%的通信被占算力配合首创的细粒度重计算技术将开销降至原有的1/4全方位提升计算效率与系统吞吐量。▼超长上下文支持专为AI Coding打造通过高效算子融合及框架极致优化MTT S5000在确保代码生成质量的同时显著降低了响应延迟。无论是处理复杂的代码库分析还是运行长周期的智能体Agent任务均能保持首字延迟TTFT低、生成速度快的流畅体验。MTT S5000与GLM-5的软硬双强组合在函数补全、漏洞检测等核心场景的表现超越同级充分释放模型的规划能力和Debug能力是执行长程开发任务的理想选择。从GLM-4.6、GLM-4.7到GLM-5摩尔线程已将“发布即适配”化为常态这种对主流软件栈的无缝兼容与敏捷响应充分证明了国产全功能GPU及MUSA软件栈的成熟度与稳定性确保开发者能第一时间触达最新模型能力从而携手共建蓬勃发展的国产AI生态。

相关新闻

用过才敢说 10个降AI率软件降AIGC网站:本科生必看的降AI率测评与推荐

用过才敢说 10个降AI率软件降AIGC网站:本科生必看的降AI率测评与推荐

在当前高校论文写作中,AI生成内容的痕迹越来越明显,许多学生在使用AI工具辅助写作后,发现论文的AIGC率过高,导致查重系统无法通过。面对这样的问题,越来越多的学生开始寻找有效的降AI率工具,希望通过科学的…

2026/7/4 19:17:01 阅读更多 →
赶deadline必备! 8个AI论文平台测评:研究生学术写作与毕业论文神器推荐

赶deadline必备! 8个AI论文平台测评:研究生学术写作与毕业论文神器推荐

在学术研究日益数字化的今天,研究生群体面临着前所未有的写作压力。从选题构思到文献综述,从数据分析到论文撰写,每一个环节都可能成为“卡壳”的节点。尤其在临近截止日期时,如何高效完成高质量的学术论文,成为许多学…

2026/5/17 4:17:33 阅读更多 →
AI4Science开源数据汇总

AI4Science开源数据汇总

1. Well 全称:The Well: A Large-Scale Collection of Diverse Physics Simulations for Machine Learning 核心特点:多样性与真实科学场景。 内容:这是一个极其庞大的物理模拟数据集集合(约 15TB)。它不仅仅包含流…

2026/7/3 19:47:21 阅读更多 →

最新新闻

AI 压测数据回放:让模型读报告之前先校准口径

AI 压测数据回放:让模型读报告之前先校准口径

AI 压测数据回放:让模型读报告之前先校准口径 一、压测报告不能直接丢给模型 AI 可以帮助分析压测结果,但前提是输入数据口径清楚。很多压测报告里混着预热阶段、限流阶段、错误重试、下游故障和业务噪声。如果直接让模型总结,很容易得到一段…

2026/7/5 1:22:14 阅读更多 →
AI工具链选型:GitHub Copilot与Cursor、Codeium企业开发场景实测对比

AI工具链选型:GitHub Copilot与Cursor、Codeium企业开发场景实测对比

AI工具链选型:GitHub Copilot与Cursor、Codeium企业开发场景实测对比 一、评测体系设计与方法论 AI编码助手已成为开发效率的关键杠杆。本次评测聚焦三项主流工具的实际表现。从四个维度建立可复现的量化评测框架。 %%{init: {theme: base}}%% radartitle AI编码助手…

2026/7/5 1:20:14 阅读更多 →
PyTorch 数据加载瓶颈:GPU 空等时先看 DataLoader

PyTorch 数据加载瓶颈:GPU 空等时先看 DataLoader

PyTorch 数据加载瓶颈:GPU 空等时先看 DataLoader 一、训练慢不一定是模型慢 PyTorch 训练时,很多人看到速度慢就先改模型、调 batch size、换显卡。但如果 GPU 利用率忽高忽低,可能瓶颈根本不在模型,而在数据加载。图片解码、文本…

2026/7/5 1:20:14 阅读更多 →
群晖DSM 7.2.2视频管理终极解决方案:免费恢复Video Station完整功能

群晖DSM 7.2.2视频管理终极解决方案:免费恢复Video Station完整功能

群晖DSM 7.2.2视频管理终极解决方案:免费恢复Video Station完整功能 【免费下载链接】Video_Station_for_DSM_722 Script to install Video Station in DSM 7.2.2 and DSM 7.3 项目地址: https://gitcode.com/gh_mirrors/vi/Video_Station_for_DSM_722 你是否…

2026/7/5 1:20:14 阅读更多 →
云原生可观测性:构建全链路监控体系

云原生可观测性:构建全链路监控体系

引言在微服务架构和容器化部署成为主流的当下,系统的复杂性呈指数级增长。一个请求可能跨越数十个服务实例,传统的日志查看和单点监控已无法满足故障排查的需求。云原生可观测性(Observability)应运而生,它通过Metrics…

2026/7/5 1:18:13 阅读更多 →
工训赛智能小车 PCB 自制指南:从 BTN7971B 四路驱动到主控布局的 5 个要点

工训赛智能小车 PCB 自制指南:从 BTN7971B 四路驱动到主控布局的 5 个要点

工训赛智能小车PCB设计实战:从四路驱动到主控布局的进阶指南在工程训练综合能力竞赛的智能物流搬运赛项中,一辆性能卓越的小车往往始于精良的PCB设计。当现成模块难以满足定制化需求时,自主设计PCB不仅能显著降低成本,更能实现整车…

2026/7/5 1:18:13 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻