GLM-5 擁有 754B 參數(40B 活躍)和專為長時程代理人工作流程設計的架構,可說是為 Claude Code 的強項量身打造:多步驟、大量工具呼叫的編碼工作階段,需要對數千行程式碼持續推理。
本指南將說明如何透過 Novita AI 等 API 供應商將 GLM-5 整合到 Claude Code,讓您以 $1.00/$3.20 每百萬 token 的價格獲得前沿的編碼智慧——僅為專有模型成本的一小部分。無論您是在除錯複雜系統、重構舊有程式碼庫,還是建立多檔案功能,GLM-5 的 200K+ 上下文視窗與經過驗證的代理人能力,都使其成為理想的 Claude Code 後端。
為什麼 GLM-5 在代理人編碼任務中表現出色
在進行設定之前,有必要了解 GLM-5 為何特別適合 Claude Code 工作流程。與以對話為主的模型不同,GLM-5 在訓練時特別強調複雜系統工程與長時程代理人任務——這正是 Claude Code 所需的工作負載。
經過驗證的代理人基準測試表現


前端建置成功率(98%)顯示 GLM-5 更像一個「工程執行」模型,表示它極有能力產出能在真實開發環境中實際成功運行的輸出。
專為程式碼生成最佳化的架構
- DeepSeek 稀疏注意力(DSA): 有效處理 200K+ 上下文視窗,對於全倉庫感知至關重要
- 28.5T token 訓練語料: 比 GLM-4.5 的 23T token 更大且更多樣化,提升了程式碼模式識別能力
- 透過
slime的強化學習: 非同步 RL 基礎設施專門針對工具呼叫準確度與多輪連貫性對模型進行微調
工具呼叫與函式支援
GLM-5 包含原生 --tool-call-parser glm47 支援(已在 vLLM 和 SGLang 部署文件中驗證),表示它可以:
- 解析並執行結構化函式呼叫而不會產生幻覺語法
- 在 10 個以上連續步驟中維持工具呼叫準確度
- 可靠處理 Claude Code 的
Read、Write、Edit和Bash工具
Vending Bench 2 ROI 比較
| 模型 | 最終資金餘額(≈ 第 365 天) | 成本 | ROI = 餘額 / 成本 |
|---|---|---|---|
| Gemini 3 Pro | 5300 | 5478.16 | 0.97 |
| Claude Opus 4.5 | 4950 | 4967.06 | 1.00 |
| GLM-5 | 4350 | 4432.12 | 0.98 |
| GPT-5.2 | 3550 | 3591.33 | 0.99 |
| GLM-4.7 | 2350 | 2376.82 | 0.99 |
| Kimi K2.5 | 1150 | 1198.46 | 0.96 |
GLM-5 是一個高執行、高報酬的代理人模型,但這是透過高計算/工具使用成本來達成的。它本質上是一個「多付多得」的工程導向代理人。
什麼是 Claude Code?
Claude Code 是 Anthropic 的代理人編碼助手,以桌面應用程式形式提供(macOS/Linux)。它將類似 VS Code 的編輯器與終端感知的 AI 代理人結合,可以讀取檔案、撰寫程式碼、執行命令,並自主反覆執行任務。可以把它想像成「具備完整終端存取權限 + 多步驟任務執行的 Cursor」。
主要優勢:
- 深度終端整合(可直接執行
npm install、git commit、pytest等) - 跨階段持續的工作區狀態
- 10 個以上專用工具(Glob、Grep、WebFetch、精確字串替換的 Edit)
- MCP(模型上下文協定)支援,可自訂工具外掛
使用案例
| 使用案例 | 情境 |
|---|---|
| 複雜系統重構 | 將單體架構遷移為跨 50 個以上檔案的微服務 |
| 終端密集型工作流程 | 部署 Docker 堆疊、執行遷移、除錯 K8s |
| 深度除錯階段 | 追蹤 segfault、分析核心傾印、修復競爭條件 |
| 自訂工作流程自動化 | 將 GLM-5 與 MCP 伺服器(Slack、GitHub、Notion)整合 |
如何在 Claude Code 中使用 GLM-5:完整設定指南
Claude Code 支援透過 OpenAI 相容的 API 端點使用自訂模型。我們將使用 Novita AI 作為供應商,因為它提供無伺服器的 GLM-5 託管服務,定價透明(每百萬 token $1.00/$3.20)。
步驟 1:獲取 Novita AI API 金鑰
- 前往 novita.ai
- 註冊或登入您的帳戶
- 在控制台中導航至 API Keys
- 點選 Create New Key 並複製金鑰
- 安全儲存——您將在環境變數中使用它

步驟 2:安裝 Claude Code
#macOS、Linux、WSL:
curl -fsSL https://claude.ai/install.sh | bash
#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex
#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
Windows 需要 Git for Windows。 如果尚未安裝,請先安裝。
步驟 3:設定環境變數
Claude Code 從環境變數讀取設定。請在您的 shell 設定檔中設定這些變數:
對於 macOS/Linux:
# 設定由 Novita 提供的 Anthropic SDK 相容 API 端點。
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# 設定由 Novita 提供的模型。
export ANTHROPIC_MODEL="zai-org/glm-5"
export ANTHROPIC_SMALL_FAST_MODEL="zai-org/glm-5"
對於 Windows:
# 新增至您的 PowerShell 設定檔
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Novita API Key"
$env:ANTHROPIC_MODEL = "zai-org/glm-5"
$env:ANTHROPIC_SMALL_FAST_MODEL = "zai-org/glm-5"
重要: ANTHROPIC_SMALL_FAST_MODEL 變數用於快速任務(檔案導覽、搜尋)。
步驟 4:啟動 Claude Code
接下來,導航到您的專案目錄並啟動 Claude Code。Claude Code 會分析當前專案目錄,並將其作為工作上下文。您將在新的互動式階段中看到 Claude Code 提示。
cd <您的專案目錄>
claude .
步驟 5:搭配 Git 使用 Claude Code
Claude Code 讓 Git 操作變成對話式:
> 我改了哪些檔案?
> 提交我的變更並附上描述性訊息
您也可以提示更複雜的 Git 操作:
> 建立一個名為 feature/quickstart 的新分支
> 顯示最近 5 次提交
> 協助我解決合併衝突
效能提示:充分發揮 GLM-5 的潛力
1. 充分利用上下文視窗
GLM-5 的 200K+ 上下文是一大優勢。不要只問「修正這個函式」,而是載入整個模組:
提示:"Read all files in src/auth/. Analyze the authentication flow, identify security vulnerabilities, and propose fixes with code examples."
2. 使用具體的工具呼叫
在需要時明確引導 GLM-5 使用正確的工具:
提示:"Use Grep to find all occurrences of 'deprecated_function' across the codebase, then use Edit to replace them with 'new_function'."
3. 啟用推測解碼(適用於自架設)
如果您透過 vLLM 在本地執行 GLM-5,請使用 --speculative-config.method mtp 以獲得 30-50% 的生成速度提升。
4. 逐步鏈結任務
將複雜專案分解為 3-5 個步驟的區塊:
階段 1:"Design the database schema for a blogging platform. Create SQLAlchemy models."
階段 2:"Implement CRUD endpoints for posts using FastAPI."
階段 3:"Add authentication middleware and rate limiting."
該模型的 754B 參數 MoE 架構、200K+ 上下文視窗以及針對複雜系統工程的專門訓練,使其特別適合倉庫級別的重構、多步驟除錯和代理人自動化。無論您是否選擇 Claude Code 進行終端密集型工作流程,GLM-5 的效能基準和成本效益都使其成為 2026 年開發者導向 AI 工具的首選。
常見問題
GLM-5 可以本地執行,還是必須使用 API?
GLM-5 可以透過 vLLM 或 SGLang 在本地執行,但需要 16× H100 80GB GPU 進行 FP8 量化。API 託管(Novita、OpenRouter)對大多數使用者來說更為實用。
GLM-5 在編碼方面與 DeepSeek V3 相比如何?
GLM-5 在代理人基準測試中得分更高(Intelligence Index 50 vs. DeepSeek V3 的 45),而 DeepSeek V3 在純程式碼補全方面更快。對於多步驟任務請選擇 GLM-5。
GLM-5 是否支援函式呼叫和工具使用?
是的——GLM-5 包含原生 --tool-call-parser glm47 和 --enable-auto-tool-choice 支援,已在官方部署指南中驗證。
Novita AI 是一個 AI 雲端平台,為開發者提供透過簡單 API 部署 AI 模型的便捷方式,同時也提供價格實惠且可靠的 GPU 雲端用於建置與擴展。
推薦閱讀
在 Claude Code 中使用 Qwen3-Coder-Next:便宜 80% 的替代方案
[Kimi k2.5 API for Cursor:開發者指南](http://Kimi k2.5 API for Cursor:開發者指南)
