当前位置: 首页 » 资讯 » AI智能 » 正文

GLM-4.5发布：面向推理、代码与智能体的开源SOTA模型

来源：投资界综合 47707/31

今天，智谱带来新一代旗舰模型GLM-4.5，专为智能体应用打造的基础模型。Hugging Face 与 ModelScope 平台同步开源，模型权重遵循MIT License。要点如下：GLM-4.5 在包含推理、代码、智能体的综合能力达到

标签：智谱 GLM-4.5 开源模型

今天，智谱带来新一代旗舰模型GLM-4.5，专为智能体应用打造的基础模型。Hugging Face 与 ModelScope 平台同步开源，模型权重遵循MIT License。

要点如下：

GLM-4.5 在包含推理、代码、智能体的综合能力达到开源 SOTA，在真实代码智能体的人工对比评测中，实测国内*；

采用混合专家（MoE）架构，包括 GLM-4.5：总参数量3550 亿，激活参数 320 亿；GLM-4.5-Air：总参数1060 亿，激活参数 120 亿；

两种模式：用于复杂推理和工具使用的思考模式，及用于即时响应的非思考模式；

高速、低成本：API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens；高速版最高可达100 tokens/秒。

API 已上线开放平台BigModel.cn，可以一键兼容Claude Code框架。同时，大家也可以上智谱清言(chatglm.cn)和z.ai免费体验满血版。欢迎开发者、企业、用户广泛测试与集成，探索AGI 的奥秘。

综合性能SOTA

衡量 AGI 的第一性原理，是在不损失原有能力的前提下融合更多通用智能能力，GLM-4.5 是我们对此理念的首次完整呈现，并有幸取得技术突破。GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合，以满足智能体应用的复杂需求。

为综合衡量模型的通用能力，我们选择了最具有代表性的 12 个评测基准，包括MMLU Pro、AIME24、MATH 500、SciCode、GPQA、HLE、LiveCodeBench、SWE-BenchVerified、Terminal-Bench、TAU-Bench、BFCL v3和BrowseComp。综合平均分，GLM-4.5 取得了全球模型第三、国产模型*，开源模型*。

GLM-4.5 和 GLM-4.5-Air 使用了相似的训练流程：首先在 15 万亿token的通用数据上进行了预训练，此后在代码、推理、智能体等领域的8 万亿 token数据上进行针对性训练，最后通过强化学习进一步增强模型推理、代码与智能体能力。更多技术细节可参考我们的技术博客（https://z.ai/blog/glm-4.5），后续也会发布更加详细的技术报告。

更高参数效率

GLM-4.5 参数量为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3，但在多项标准基准测试中表现得更为出色，这得益于 GLM 模型的更高参数效率。在衡量模型代码能力的SWE-bench Verified榜单上，GLM-4.5 系列位于性能/参数比帕累托前沿，表明在相同规模下 GLM-4.5 系列实现了*性能。

低成本、高速度

在性能优化之外，GLM-4.5 系列也在成本和效率上实现突破，由此带来远低于主流模型定价：API 调用价格低至输入 0.8 元/百万 tokens，输出 2 元/百万 tokens。

同时，高速版本实测生成速度最高可至100 tokens/秒，支持低延迟、高并发的实际部署需求，兼顾成本效益与交互体验。

真实体验

真实场景表现比榜单更重要。为评测 GLM-4.5 在真实场景 Agent Coding 中的效果，我们接入 Claude Code 与 Claude-4-Sonnet、Kimi-K2、Qwen3-Coder 进行对比测试。测试采用 52 个编程开发任务，涵盖六大开发领域，在独立容器环境中进行多轮交互测试。实测结果显示（如下图），GLM-4.5 相对其他开源模型展现出竞争优势，特别在工具调用可靠性和任务完成度方面表现突出。尽管 GLM-4.5 相比 Claude-4-Sonnet 仍有提升空间，在大部分场景中可以实现平替的效果。

为确保评测透明度，我们公布了52道题目及 Agent 轨迹，供业界验证复现。

Agent 轨迹：https://huggingface.co/datasets/zai-org/CC-Bench-trajectories

模型原生 Agent 场景

GLM-4.5 系列能胜任全栈开发任务，编写复杂应用、游戏、交互网页。这得益于模型原生具备的在前端编写网站、在后端进行数据库管理，以及通过工具调用接口支持任意的智能体应用等能力。

全栈开发实际效果

一个真的能搜索的搜索引擎

Z.ai版本“谷歌搜索”体验地址：

https://n0x9f6733jm1-deploy.space.z.ai

提示词详见轨迹地址：

https://chat.z.ai/s/2bd291ba-fe6a-4026-a8f4-1efa498267b2

一个真的能发弹幕的B站

Z.ai版本“B站”体验地址：

https://n0dba6ce0e60-deploy.space.z.ai

提示词详见轨迹地址：

https://chat.z.ai/s/29968fdc-53f2-4605-ae71-4ae32e920ca4

一个真的能发博的微博

Z.ai版本“微博”体验地址：

https://v0rb06rruyf0-deploy.space.z.ai/

提示词详见轨迹地址：

https://chat.z.ai/s/f78ae64c-06b7-4eee-b657-878da94fa2c7

Artifacts实际效果

GLM-4.5 不仅擅长处理复杂代码，同时也具有优秀的数据精准处理、交互动画设计能力。以下是 GLM-4.5 制作的一个 Flappy Bird 小游戏，欢迎大家前来挑战。

Flappy Bird体验地址：https://chat.z.ai/space/b0yb2613ybp0-art

提示词详见轨迹地址：https://chat.z.ai/s/2a9a1a90-545b-4f29-b6ac-854539dcc323

PPT实际效果

GLM-4.5 在制作PPT过程中会自主搜索资料、寻找配图，根据材料以 HTML 形式编写图文，使信息更准确、排版更灵活。除了16:9的PPT，也可以制作长图、小红书、社交媒体封面或简历等多比例图片。

如何体验

GLM-4.5 深度优化全栈编程与工具调用，兼容Claude Code、Cline、Roo Code等主流代码智能体，到智谱开放平台即可体验。

国内用户：

https://docs.bigmodel.cn/cn/guide/develop/claude

海外用户：

https://docs.z.ai/scenario-example/develop-tools/claude

体验地址：

https://chat.z.ai/

https://chatglm.cn

Github 仓库：

https://github.com/zai-org/GLM-4.5

模型仓库：

HuggingFace：

https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b

ModelScope：

https://modelscope.cn/collections/GLM-45-b8693e2a08984f

免责声明：本网转载合作媒体、机构或其他网站的公开信息，并不意味着赞同其观点或证实其内容的真实性，信息仅供参考，不作为交易和服务的根据。转载文章版权归原作者所有，如有侵权或其它问题请及时告之，本网将及时修改或删除。凡以任何方式登录本网站或直接、间接使用本网站资料者，视为自愿接受本网站声明的约束。联系电话 188-166-20669 ，谢谢。

首页

资讯

财博号

品牌

专题

学院

发布文章

热点

公司

产业

投资

芯片

AI智能

健康

新能源

新材料

商业航天

会议会展