如何在 Claude Code 中使用 GLM-5：设置指南

为什么 GLM-5 在智能体编码任务中表现出色
什么是 Claude Code？
如何在 Claude Code 中使用 GLM-5：完整设置指南
性能提示：充分利用 GLM-5
常见问题

GLM-5 拥有 754B 参数（40B 活跃），并采用专为长周期智能体工作流设计的特殊架构，专为 Claude Code 的强大应用场景而打造：需要在上千行代码中持续推理的多步骤、强工具调用的编码会话。

本指南将向您展示如何通过 API 提供商（如 Novita AI）将 GLM-5 集成到 Claude Code 中，从而以每百万 token 1.00/3.20 美元的价格获得前沿编码智能——仅为专有模型成本的一小部分。无论您是调试复杂系统、重构遗留代码库，还是构建多文件功能，GLM-5 的 200K+ 上下文窗口和经过验证的智能体能力使其成为理想的 Claude Code 后端。

为什么 GLM-5 在智能体编码任务中表现出色

在深入设置之前，有必要了解 为什么 GLM-5 特别适合 Claude Code 工作流。与专注于聊天的模型不同，GLM-5 在训练时明确强调复杂系统工程和长周期智能体任务——这正是 Claude Code 所要求的工作负载。

经过验证的智能体基准性能

前端构建成功率（98%）表明 GLM-5 更像一个“工程执行”模型，这意味着它在实际开发环境中生成能够成功运行的输出方面能力极强。

针对代码生成优化的架构

DeepSeek 稀疏注意力（DSA）： 有效处理 200K+ 上下文窗口，对于仓库级感知至关重要
28.5T token 训练语料库： 比 GLM-4.5 的 23T token 更大、更多样化，提高了代码模式识别能力
通过 slime 进行强化学习： 异步 RL 基础设施专门针对工具调用准确性和多轮连贯性对模型进行了微调

工具调用和函数支持

GLM-5 包含原生 --tool-call-parser glm47 支持（在 vLLM 和 SGLang 部署文档中已验证），这意味着它可以：

解析并执行结构化函数调用，不会产生语法幻觉
在 10+ 个连续步骤中保持工具调用准确性
可靠地处理 Claude Code 的 Read、Write、Edit 和 Bash 工具

Vending Bench 2 ROI 对比

模型	最终资金余额（约第365天）	成本	ROI = 余额 / 成本
Gemini 3 Pro	5300	5478.16	0.97
Claude Opus 4.5	4950	4967.06	1.00
GLM-5	4350	4432.12	0.98
GPT-5.2	3550	3591.33	0.99
GLM-4.7	2350	2376.82	0.99
Kimi K2.5	1150	1198.46	0.96

GLM-5 是一个高执行、高回报的智能体模型，但它是通过高计算/工具使用成本来实现这一点的。它本质上是一个“多花钱、多办事”的工程导向智能体。

立即尝试 GLM 5！

什么是 Claude Code？

Claude Code 是 Anthropic 发布的智能体编码助手，以桌面应用程序（macOS/Linux）的形式提供。它结合了类 VS Code 的编辑器与终端感知型 AI 智能体，可以自主读取文件、编写代码、执行命令并迭代完成任务。可以将其视为“具备完整终端访问权限 + 多步骤任务执行的 Cursor”。

主要优势：

深度终端集成（可直接运行 npm install、git commit、pytest 等）
跨会话保持工作区状态
10+ 个专用工具（Glob、Grep、WebFetch、支持精确字符串替换的 Edit）
用于自定义工具插件的 MCP（模型上下文协议）支持

使用场景

使用场景	应用场景
复杂系统重构	将单体应用迁移到跨越 50+ 个文件的微服务
终端密集型工作流	部署 Docker 栈、运行迁移、调试 K8s
深度调试会话	追踪段错误、分析核心转储、修复竞态条件
自定义工作流自动化	将 GLM-5 与 MCP 服务器（Slack、GitHub、Notion）集成

如何在 Claude Code 中使用 GLM-5：完整设置指南

Claude Code 通过兼容 OpenAI 的 API 端点支持自定义模型。我们将使用 Novita AI 作为提供商，因为它提供无服务器的 GLM-5 托管服务，并配有透明的定价（每百万 token 1.00/3.20 美元）。

步骤 1：获取 Novita AI 的 API 密钥

访问 novita.ai
注册或登录您的账户
在控制面板中导航到 API Keys
点击 Create New Key 并复制密钥
安全存储——后续设置环境变量时需要用到

立即尝试 GLM 5！

步骤 2：安装 Claude Code

#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash

#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex

#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd

Windows 需要 Git for Windows。 如果尚未安装，请先安装。

步骤 3：配置环境变量

Claude Code 从环境变量读取配置。在您的 shell 配置文件中设置这些变量：

对于 macOS/Linux：

# 设置 Novita 提供的 Anthropic SDK 兼容 API 端点。
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# 设置 Novita 提供的模型。
export ANTHROPIC_MODEL="zai-org/glm-5"
export ANTHROPIC_SMALL_FAST_MODEL="zai-org/glm-5"

对于 Windows：

# 添加到您的 PowerShell 配置文件中

$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Novita API Key"
$env:ANTHROPIC_MODEL = "zai-org/glm-5"
$env:ANTHROPIC_SMALL_FAST_MODEL = "zai-org/glm-5"

重要提示： ANTHROPIC_SMALL_FAST_MODEL 变量用于快速任务（文件导航、搜索）。

步骤 4：启动 Claude Code

接下来，导航到您的项目目录并启动 Claude Code。Claude Code 将分析当前项目目录并将其用作工作上下文。您将在新的交互式会话中看到 Claude Code 提示符。

cd <your-project-directory>
claude .

步骤 5：将 Git 与 Claude Code 配合使用

Claude Code 使 Git 操作变得对话式：

> 我修改了哪些文件？

> 用描述性消息提交我的更改

您还可以提示更复杂的 Git 操作：

> 创建一个名为 feature/quickstart 的新分支

> 显示最近 5 次提交

> 帮助我解决合并冲突

性能提示：充分利用 GLM-5

1. 充分利用上下文窗口

GLM-5 的 200K+ 上下文是一个主要优势。不要问“修复这个函数”，而是加载整个模块：

提示：“读取 src/auth/ 中的所有文件。分析身份验证流程，识别安全漏洞，并提出包含代码示例的修复方案。”

2. 使用特定的工具调用

必要时明确引导 GLM-5 使用合适的工具：

提示：“使用 Grep 在整个代码库中查找所有 'deprecated_function' 的出现，然后使用 Edit 将它们替换为 'new_function'。”

3. 启用推测解码（适用于自托管）

如果通过 vLLM 本地运行 GLM-5，请使用 --speculative-config.method mtp 将生成速度提升 30-50%。

4. 将任务分步增量执行

将复杂项目分解为 3-5 步的块：

会话 1：“为博客平台设计数据库模式。创建 SQLAlchemy 模型。”
会话 2：“使用 FastAPI 实现帖子的 CRUD 端点。”
会话 3：“添加身份验证中间件和速率限制。”

该模型拥有 754B 参数的 MoE 架构、200K+ 上下文窗口，以及针对复杂系统工程的专业训练，使其特别适合仓库级重构、多步骤调试和智能体自动化。无论您是否选择 Claude Code 进行终端密集型工作流，GLM-5 的性能基准测试和成本效益都使其成为 2026 年面向开发者的 AI 工具的首选。

常见问题

GLM-5 可以本地运行，还是必须使用 API？

GLM-5 可以通过 vLLM 或 SGLang 本地运行，但需要 16 块 H100 80GB GPU 来支持 FP8 量化。对于大多数用户来说，API 托管（Novita、OpenRouter）更加实用。

GLM-5 在编码方面与 DeepSeek V3 相比如何？

GLM-5 在智能体基准测试上得分更高（智能指数 50 vs. DeepSeek V3 的 45），而 DeepSeek V3 在纯代码补全方面更快。选择 GLM-5 用于多步骤任务。

GLM-5 是否支持函数调用和工具使用？

是的——GLM-5 包含原生 --tool-call-parser glm47 和 --enable-auto-tool-choice 支持，已在官方部署指南中得到验证。

Novita AI 是一个 AI 云平台，为开发者提供通过简单 API 部署 AI 模型的便捷方式，同时提供经济实惠且可靠的 GPU 云用于构建和扩展。

[Kimi k2.5 API 用于 Cursor：开发者指南](http://Kimi k2.5 API for Cursor: Developer Guide)

DeepSeek R1 0528 成本：API、GPU、本地部署对比

如何在 Claude Code 中使用 GLM-5：设置指南

为什么 GLM-5 在智能体编码任务中表现出色

什么是 Claude Code？

如何在 Claude Code 中使用 GLM-5：完整设置指南

性能提示：充分利用 GLM-5

常见问题

Product

RESOURCES

Partners

Company

为什么 GLM-5 在智能体编码任务中表现出色

什么是 Claude Code？

如何在 Claude Code 中使用 GLM-5：完整设置指南

性能提示：充分利用 GLM-5

常见问题

相关文章

Product

RESOURCES

Partners

Company