主页 > 科技IT

Day－0支持！摩尔线程MTT S5000率先适配智谱GLM－5

科技IT 2026-02-12 69852srtt

首页 > 芯闻 > Day－0支持！摩尔线程MTT S5000率先适配智谱GLM－5

Day－0支持！摩尔线程MTT S5000率先适配智谱GLM－5

关键词：摩尔线程MTT S5000

时间：2026-2-12 17:35:08 来源：互联网

“ 2月11日，智谱正式发布新一代大模型GLM-5。摩尔线程基于SGLang推理框架，在旗舰级AI训推一体全功能GPU MTT S5000上，Day-0完成了全流程适配与验证。
”

2月11日，智谱正式发布新一代大模型GLM-5。摩尔线程基于SGLang推理框架，在旗舰级AI训推一体全功能GPU MTT S5000上，Day-0完成了全流程适配与验证。

凭借MUSA架构广泛的算子覆盖与强大的生态兼容能力，摩尔线程成功打通了模型推理全链路，并深度释放MTT S5000的原生FP8加速能力，在确保模型精度的同时显著降低了显存占用，实现了GLM-5的高性能推理。此次快速适配，不仅印证了MUSA软件栈的成熟度，更充分展现了国产全功能GPU对最新大模型即时、高效的支持能力。

GLM-5与MTT S5000的国产双强联合，将为开发者带来可对标国际顶尖模型的极致编程体验。无论是在函数补全、漏洞检测还是Debug场景中，该组合均表现卓越，以显著增强的逻辑规划能力，从容应对各类复杂的长程任务挑战。

GLM-5核心特性：

定义Agentic Engineering新高度

作为GLM系列的最新里程碑版本，GLM-5定位为当下顶尖的Coding模型，整体性能较上一代提升20%。其核心突破在于Agentic Engineering（代理工程）能力——不仅具备深厚的代码功底，更拥有处理复杂系统工程与长程Agent任务的实力，能够实现从需求到应用的端到端开发。

在全球权威的Artificial Analysis榜单中，GLM-5位居全球第四、开源第一。

GLM-5在编程能力上实现了对齐Claude Opus 4.5，在业内公认的主流基准测试中取得开源模型SOTA。在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的开源模型最高分数，性能超过 Gemini 3 Pro。

在内部Claude Code评估集合中，GLM-5在前端、后端、长程任务等编程开发任务上显著超越上一代的GLM-4.7（平均增幅超过20%），能够以极少的人工干预，自主完成Agentic长程规划与执行、后端重构和深度调试等系统工程任务，使用体感逼近Opus 4.5。

摩尔线程核心优势：

软硬协同的全栈算力底座

MTT S5000是专为大模型训练、推理及高性能计算而设计的全功能GPU智算卡，基于第四代MUSA架构“平湖”打造。其单卡AI算力最高可达1000 TFLOPS，配备80GB显存，显存带宽达到1.6TB/s，卡间互联带宽为784GB/s，完整支持从FP8到FP64的全精度计算。

依托MUSA全栈平台，MTT S5000原生适配PyTorch、Megatron-LM、vLLM及SGLang等主流框架，助力用户实现“零成本”代码迁移。无论是构建万卡级大规模训练集群，还是部署高并发、低延迟的在线推理服务，MTT S5000均展现出对标国际主流旗舰产品的卓越性能与稳定性，旨在为行业筑牢坚实、易用的国产算力底座。

此次实现对GLM-5模型的快速支持，正是摩尔线程基于MTT S5000构建的软硬协同技术能力的集中体现：

▼ 底层架构与生态兼容：天生适配，极速迁移

针对GLM-5的长序列推理场景，MTT S5000凭借充沛的算力储备与高计算密度，结合对稀疏Attention的架构级支持，在大规模上下文处理中依然保持高吞吐与低延迟。同时，MUSA软件栈的敏捷性是实现Day-0适配的关键。基于MUSA架构的TileLang原生算子单元测试覆盖率已超过80%，使得绝大多数通用算子可直接复用，显著降低移植成本，并能快速跟进前沿模型结构与新特性演进。

▼ 原生FP8加速：SGLang 框架深度优化

基于高性能的SGLang-MUSA推理引擎及MTT S5000的硬件原生FP8计算单元，摩尔线程实现了推理效率的跃升。与传统BF16相比，原生FP8在保持GLM-5卓越的代码生成与逻辑推理能力（精度无损）的同时，大幅降低了显存占用，并显著提升了推理吞吐量，为大规模部署提供了更高性价比的方案。

▼ 独创ACE引擎：通信计算并行，释放极致吞吐

针对大模型分布式推理中的通信痛点，MTT S5000利用独创的异步通信引擎（ACE），将复杂的通信任务从计算核心中卸载，实现了物理级的“通信计算重叠”。这一机制有效释放15%的通信被占算力，配合首创的细粒度重计算技术（将开销降至原有的1/4），全方位提升计算效率与系统吞吐量。

▼ 超长上下文支持：专为AI Coding打造

通过高效算子融合及框架极致优化，MTT S5000在确保代码生成质量的同时显著降低了响应延迟。无论是处理复杂的代码库分析，还是运行长周期的智能体（Agent）任务，均能保持首字延迟（TTFT）低、生成速度快的流畅体验。MTT S5000与GLM-5的软硬双强组合，在函数补全、漏洞检测等核心场景的表现超越同级，充分释放模型的规划能力和Debug能力，是执行长程开发任务的理想选择。

从GLM-4.6、GLM-4.7到GLM-5，摩尔线程已将“发布即适配”化为常态，这种对主流软件栈的无缝兼容与敏捷响应，充分证明了国产全功能GPU及MUSA软件栈的成熟度与稳定性，确保开发者能第一时间触达最新模型能力，从而携手共建蓬勃发展的国产AI生态。

上一篇：【已经是第一篇了】

下一篇：【行业首个，三星电子启动 HBM4 内存量产并向客户交付商用产品】

猜你喜欢

芯闻
芯品
方案
文章

• Day－0支持！摩尔线程MTT S5000率先适配智谱GLM－5
• 行业首个，三星电子启动 HBM4 内存量产并向客户交付商用产品
• 京东与美的、海尔、海信、TCL 签署 2026 年战略合作协议，明确 1800 亿销售目标
• 三星电子公布垂直堆叠 zHBM，宣称定制 cHBM 能效可达标准品 2.8 倍

• 贸泽电子开售适用于工业自动化的 Omron Electronics全新E8Y－L带数字显示器的微压传感器
• 六联智能正式推出 W890E1 工作站主板，提供 7 条全长 PCIe 5.0 插槽
• 微星上线 MEG X870E GODLIKE MAX 主板：延续原版设计，“MAX” 化配置
• Microchip 推出生产就绪型全栈边缘 AI 解决方案，赋能MCU和MPU实现智能实时决策

• 【干货】米尔T153开发板AD7616高速ADC采集系统详解
• 基于降压转换器的工业图像传感器供电方案教程
• 澜起科技发布PCIe 6.x／CXL 3.x AEC解决方案，赋能新一代数据中心高效互连
• 全场景工控与网关解决方案：从入门到旗舰的一站式选型

• 当主控芯片架构不断变化时，系统研发团队真正需要什么样的开发平台？
• 一块布卡住AI供应链产业涨价潮带动涨停潮
• “芯片之母”EDA产业深度解析：IPO潮起，全栈化生态构建成破局关键
• 中国好屏，标准为尺：全球显示迎来“中国时刻”

来源:中电网

The End

免责声明：本文内容来源于第三方或整理自互联网，本站仅提供展示，不拥有所有权，不代表本站观点立场，也不构成任何其他建议，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容，请及时联系我们进行处理。

上一篇：马年红包大战：AI应用如何从春节尝鲜跨越到日常刚需？

下一篇：比特网早报：具身天工3.0发布，腾讯云推出一站式AI漫剧解决方案

Day－0支持！摩尔线程MTT S5000率先适配智谱GLM－5

Day－0支持！摩尔线程MTT S5000率先适配智谱GLM－5

分类导航

最新文章

本栏文章

随机文章

友情链接

Day－0支持！摩尔线程MTT S5000率先适配智谱GLM－5

Day－0支持！摩尔线程MTT S5000率先适配智谱GLM－5

相关阅读

分类导航

最新文章

本栏文章

随机文章

友情链接