Z AI（智谱 AI） - Cline 文档

Z AI（原智谱 AI）推出了具有突破性的 GLM-4.5 系列，具备混合推理能力和智能体 AI 设计。这些模型于 2025 年 7 月发布，在统一推理、编码和智能体应用方面表现出色，同时根据 MIT 许可保持开源可访问性。 网站： https://z.ai/model-api（国际）| https://open.bigmodel.cn/（中国）

获取 API 密钥

国际用户

注册/登录： 访问 https://z.ai/model-api。创建账户或登录。
导航至 API 密钥： 访问您的账户仪表板并找到 API 密钥部分。
创建密钥： 为您的应用程序生成一个新的 API 密钥。
复制密钥： 立即复制 API 密钥并安全存储。

中国大陆用户

注册/登录： 访问 https://open.bigmodel.cn/。创建账户或登录。
导航至 API 密钥： 访问您的账户仪表板并找到 API 密钥部分。
创建密钥： 为您的应用程序生成一个新的 API 密钥。
复制密钥： 立即复制 API 密钥并安全存储。

支持的模型

Z AI 根据您选择的区域提供不同的模型目录

GLM-4.5 系列

GLM-4.5 - 旗舰模型，总参数量 355B，激活参数量 32B
GLM-4.5-Air - 紧凑型模型，总参数量 106B，激活参数量 12B

GLM-4.5 混合推理模型

GLM-4.5（思维模式） - 通过逐步分析进行高级推理
GLM-4.5-Air（思维模式） - 适用于主流硬件的高效推理

所有模型都具备以下特点

128,000 token 上下文窗口，用于处理大量文档
专家混合模型 (MoE) 架构，实现最佳性能
智能体原生设计，集成推理、编码和工具使用
开源可用性，遵循 MIT 许可

在 Cline 中配置

打开 Cline 设置： 单击 Cline 面板中的设置图标 (⚙️)。
选择提供商： 从“API 提供商”下拉菜单中选择“Z AI”。
选择区域： 选择您的区域
- “International”（国际）用于全球访问
- “China”（中国）用于中国大陆访问
输入 API 密钥： 将您的 Z AI API 密钥粘贴到“Z AI API Key”字段中。
选择模型： 从“模型”下拉列表中选择您想要的模型。

GLM 编码计划

Z AI 提供专门为编码应用设计的订阅计划。这些计划通过基于提示的结构提供对 GLM-4.5 模型的经济高效的访问，而不是传统的 API 使用计费方式。

计划选项

GLM 编码精简版 - 3 美元/月

每 5 小时周期 120 个提示
访问 GLM-4.5 模型
仅通过 Cline 等编码工具使用

GLM 编码专业版 - 15 美元/月

每 5 小时周期 600 个提示
访问 GLM-4.5 模型
仅通过 Cline 等编码工具使用

这两个计划都提供首月促销价格：精简版从 6 美元降至 3 美元，专业版从 30 美元降至 15 美元。

zAI subscription page showing GLM Coding Lite and Pro plans with pricing

设置 GLM 编码计划

要将 GLM 编码计划与 Cline 配合使用

订阅： 访问 https://z.ai/subscribe 并选择您的计划。
创建 API 密钥： 订阅后，登录您的 zAI 仪表板并为您的编码计划创建 API 密钥。
在 Cline 中配置： 打开 Cline 设置，选择“Z AI”作为提供商，并将您的 API 密钥粘贴到“Z AI API Key”字段中。

Cline settings with zAI provider selected and API key field highlighted

此设置将您的订阅直接连接到 Cline，使您能够访问针对编码工作流优化的 GLM-4.5 工具调用功能。

Z AI 的混合智能

Z AI 的 GLM-4.5 系列引入了革命性的功能，使其有别于传统的语言模型

混合推理架构

GLM-4.5 在两种不同模式下运行

思维模式 (Thinking Mode)： 专为复杂的推理任务和工具使用而设计，进行更深入的分析过程
非思维模式 (Non-Thinking Mode)： 为简单的查询提供即时响应，优化效率

这种双模式架构代表了一种“智能体原生”设计理念，可根据查询复杂性调整处理强度。

卓越性能

GLM-4.5 在涵盖智能体任务、推理和编码挑战的 12 个基准测试中取得了 63.2 的综合分数，在所有专有和开源模型中位居第 3 位。GLM-4.5-Air 保持了具有竞争力的性能，分数为 59.8，同时提供了卓越的效率。

专家混合模型 (Mixture of Experts) 的卓越表现

先进的 MoE 架构优化了性能，同时保持了计算效率

GLM-4.5： 总参数量 355B，激活参数量 32B
GLM-4.5-Air： 总参数量 106B，激活参数量 12B

扩展上下文能力

128,000 token 的上下文窗口能够全面理解冗长的文档和代码库，实际测试证实了其在处理近 2,000 行代码库时仍能保持卓越性能的能力。

开源领导地位

GLM-4.5 在 MIT 许可下发布，为研究人员和开发人员提供访问最先进功能的机会，不受专有限制，包括基础模型、混合推理版本和优化的 FP8 变体。

区域优化

API 端点

国际： 使用 https://api.z.ai/api/paas/v4
中国： 使用 https://open.bigmodel.cn/api/paas/v4

模型可用性

区域设置决定了 API 端点和可用模型，并自动过滤以确保与您选择的区域兼容。

特殊功能

智能体能力

GLM-4.5 的统一架构使其特别适用于需要集成推理、编码和工具使用功能的复杂智能体应用。

全面基准测试

性能评估包括

3 个智能体任务基准测试
7 个推理基准测试
2 个编码基准测试

这种全面评估展示了其在各种 AI 应用中的多功能性。

开发者集成

模型支持通过多种框架集成

transformers
vLLM
SGLang

配备专用的模型代码、工具解析器和推理解析器实现。

性能对比

对比 Claude 4 Sonnet

GLM-4.5 在智能体编码和推理任务中表现出具有竞争力的性能，尽管 Claude Sonnet 4 在编码成功率和自主多功能应用开发方面仍保持优势。

对比 GPT-4.5

GLM-4.5 在推理和智能体基准测试中排名靠前，而 GPT-4.5 通常在 MMLU 和 AIME 等专业基准测试中在原始任务准确性方面处于领先地位。

提示和注意事项

区域选择： 选择适当的区域以获得最佳性能并符合当地法规。
模型选择： GLM-4.5 用于最高性能，GLM-4.5-Air 用于效率和主流硬件兼容性。
上下文优势： 128K 大上下文窗口支持处理大量代码库和文档。
开源益处： MIT 许可支持商业用途和二次开发。
智能体应用： 特别适用于需要推理、编码和工具使用集成的应用。
混合推理： 使用思维模式解决复杂问题，使用非思维模式解决简单查询。
API 兼容性： 与 OpenAI 兼容的 API 提供流式响应和使用情况报告。
框架支持： 为不同的部署场景提供多种集成选项。

简介

入门

最佳实践

CLI

功能

模型与提供商配置

MCP 集成

Cline 工具参考

参考

Z AI (智谱 AI)

获取 API 密钥

国际用户

中国大陆用户

支持的模型

GLM-4.5 系列

GLM-4.5 混合推理模型

在 Cline 中配置

GLM 编码计划

计划选项

设置 GLM 编码计划

Z AI 的混合智能

混合推理架构

卓越性能

专家混合模型 (Mixture of Experts) 的卓越表现

扩展上下文能力

开源领导地位

区域优化

API 端点

模型可用性

特殊功能

智能体能力

全面基准测试

开发者集成

性能对比

对比 Claude 4 Sonnet

对比 GPT-4.5

提示和注意事项

简介

入门

最佳实践

CLI

功能

模型与提供商配置

MCP 集成

Cline 工具参考

参考

​获取 API 密钥

​国际用户

​中国大陆用户

​支持的模型

​GLM-4.5 系列

​GLM-4.5 混合推理模型

​在 Cline 中配置

​GLM 编码计划

​计划选项

​设置 GLM 编码计划

​Z AI 的混合智能

​混合推理架构

​卓越性能

​专家混合模型 (Mixture of Experts) 的卓越表现

​扩展上下文能力

​开源领导地位

​区域优化

​API 端点

​模型可用性

​特殊功能

​智能体能力

​全面基准测试

​开发者集成

​性能对比

​对比 Claude 4 Sonnet

​对比 GPT-4.5

​提示和注意事项

获取 API 密钥

国际用户

中国大陆用户

支持的模型

GLM-4.5 系列

GLM-4.5 混合推理模型

在 Cline 中配置

GLM 编码计划

计划选项

设置 GLM 编码计划

Z AI 的混合智能

混合推理架构

卓越性能

专家混合模型 (Mixture of Experts) 的卓越表现

扩展上下文能力

开源领导地位

区域优化

API 端点

模型可用性

特殊功能

智能体能力

全面基准测试

开发者集成

性能对比

对比 Claude 4 Sonnet

对比 GPT-4.5

提示和注意事项