本指南將為你介紹 四種實用的 GLM-4.7 存取方式——從適合快速測試的網頁介面,到符合嚴格資料落地規範的本地部署。我們將特別聚焦 透過 Novita AI 的 API 存取,GLM-4.7 在此以 zai-org/glm-4.7 的形式提供,透過 無伺服器端點 存取——你只需幾分鐘就能從想法落地為可用的整合,無需管理推論基礎設施。
閱讀完畢後,你將清楚哪種存取方式最適合你的工作負載,並獲得可直接複製到應用程式中的逐步 API 設定,立刻開始使用 GLM-4.7 開發。
GLM-4.7 與 GLM-4.6 對比:核心升級一覽
GLM-4.7 與 GLM-4.6 維持相同的 標題級 上下文限制——200K 上下文視窗 與 最高 128K 輸出長度,但 GLM-4.7 的最大提升出現在生產環境應用最重視的領域——自主代理工作流程 與 端到端程式碼執行。你可以透過 Novita 快速體驗 GLM-4.7。

基準測試結果顯示,GLM-4.7 相較 GLM-4.6 的最大提升集中在 自主代理、工具呼叫工作流程 與 端到端程式碼執行 兩大領域。
工具使用與代理工作流程提升最顯著
- τ²-Bench:75.2 → 87.4(+12.2)
- BrowseComp(含上下文管理):57.5 → 67.5(+10.0)
實際程式碼開發可靠性提升
- SWE-bench 驗證版:68.0 → 73.8(+5.8)
終端機風格編碼代理效能大幅躍升
- Terminal Bench 2.0:24.5 → 41.0(+16.5)
結合工具的複雜推理能力顯著增強
- HLE(含工具):30.4 → 42.8(+12.4)
GLM-4.7 的適用場景?
以下為符合 GLM-4.7 特性的高價值應用場景:
- 自主編碼助手
- 「規劃 → 實作 → 測試 → 修復」循環流程
- 多檔案重構、終端機風格任務、長時間程式開發場景
- 工具呼叫代理(搜尋 + 瀏覽 + 結構化輸出)
- 可收集資料來源、比對結果並回傳結構化摘要的研究代理
- 美觀度更高的前端生成
- 登陸頁、UI 元件、符合設計規範的版面配置生成
- 辦公自動化(PPT 大綱、海報、精修寫作)
- 更可靠的格式與版面一致性,產出更完善的「可直接使用」草稿
GLM-4.7 入門指南:你的存取選項
通常你有四種實用的選擇:
先試用:Novita 網頁遊樂場(最適合新手)
如果你想快速測試提示詞、觀察 GLM-4.7 的回應表現,Novita 提供一鍵式網頁體驗。

透過 API 開發:官方端點 vs Novita AI 無伺服器(適合開發者)
適合場景: 生產環境應用、優化成本的初創團隊、希望透過單一統一 API 存取多個模型的開發團隊。
如果你需要 無伺服器擴展、相容 OpenAI 的呼叫方式、以及用量計費,GLM-4.7 已上線 Novita AI,模型名稱為 zai-org/glm-4.7。
💡Novita AI 特色:
- 無伺服器:立即執行,僅為實際使用量付費
- 計費方案:輸入權杖 $0.6 / 百萬,輸出權杖 $2.2 / 百萬
- 長上下文 + 大輸出:204,800 上下文長度,最高 131,072 輸出長度
- 支援函式呼叫、結構化輸出、推理功能
逐步教學:透過 Novita AI 的 API 使用 GLM-4.7
使用 Novita AI 的 相容 OpenAI 的統一 REST API,將 GLM-4.7 整合到你的應用程式中。
步驟 1:登入並存取模型庫 造訪 https://novita.ai/:登入(或註冊) 你的 Novita AI 帳號,並導航至模型庫頁面。
步驟 2:選擇 GLM-4.7 瀏覽可用模型,根據你的工作負載需求選擇 GLM-4.7。
步驟 3:啟用免費試用 啟動免費試用,體驗 GLM-4.7 的推理能力、長上下文處理與性價比表現。
步驟 4:取得 API 金鑰 開啟設定頁面,生成並複製你的 API 金鑰用於身份驗證。
步驟 5:安裝並呼叫 API(Python 範例) 以下為使用 Python 呼叫聊天補全 API 的簡單範例:
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="zai-org/glm-4.7",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=131072,
temperature=0.7
)
print(response.choices[0].message.content)
這個設定讓你可以控制推理深度、權杖使用量與生成行為——在需要透過逐輪推理管理成本與延遲的場景中特別實用。
自行部署:進階使用者的本地推論方案
適合場景: 離線工作負載、資料落地限制、自訂推論堆疊。
GLM-4.7 已在 Hugging Face 上以 MIT 授權開源,官方模型卡片包含本地部署指引(支援 vLLM、SGLang、transformers 框架)以及相關框架支援說明。
GPU / VRAM 需求(快速參考)
本地部署 GLM-4.7 時,VRAM 是硬性限制。所需的 GPU 記憶體主要取決於 量化位元寬度(位元越低,所需 VRAM 越少),再加上少量的執行階段開銷預留空間。
以下為實用參考(模型大小 + 估計所需 VRAM + 推薦 GPU 配置):
| 位元寬度 | 量化方式 | 模型大小 | 估計所需 VRAM | 推薦 GPU | 總 VRAM |
|---|---|---|---|---|---|
| 1-bit | TQ1_0 | 84.5 GB | ~86 GB | NVIDIA L4 ×4 | 96 GB |
| 1-bit | IQ1_S | 97.2 GB | ~99 GB | NVIDIA A100 ×2 | 160 GB |
| 1-bit | IQ1_M | 108 GB | ~110 GB | — | — |
| 3-bit | Q3_K_XL | 159 GB | ~161 GB | NVIDIA L40S ×4 | 192 GB |
| 3-bit | Q3_K_M | 171 GB | ~173 GB | NVIDIA L40S ×4 | 192 GB |
| 4-bit | IQ4_XS | 192 GB | ~194 GB | NVIDIA A100 ×4 | 320 GB |
| 8-bit | Q8_0 | 381 GB | ~383 GB | NVIDIA A100 ×8 | 640 GB |
| 16-bit | BF16 | 717 GB | ~719 GB | NVIDIA H200 ×8 | 1128 GB |
經驗法則: 請預留 比「記憶體需求」數字稍高的 VRAM(用於框架/執行階段開銷、KV 快取增長、批次處理等)。對於大多數「進階使用者本地部署」場景,3-4 位元量化是最務實的起點,而 8/16 位元量化通常需要多 GPU 伺服器。
整合至工具:IDE 代理、工具呼叫與應用框架
適合場景: 自帶 IDE 代理、多代理系統、工具呼叫型應用程式。
GLM-4.7 被明確說明在主流編碼代理環境中表現優異(例如 Claude Code 風格的工作流程)。
在 Novita AI 上,你可以將 GLM-4.7 整合到已支援 OpenAI 相容 API 的現有工具中(平台模型頁面也列出對 Anthropic API 的支援)。
如果你正在使用自主編碼設定,GLM-4.7 可作為主流 IDE 助手與編碼代理的底層模型:
- Claude Code:支援強大多步驟推理的進階自主編碼工作流程
- Qwen Code:針對開發任務優化的專業 AI 編碼工具
- Cline (VS Code):直接整合至 VS Code 的 AI 助手,支援迭代式編碼與工具執行
- Cursor IDE:提供無縫 AI 編碼體驗的現代化 IDE
- Trae:適合指令式工作流程的終端機型 AI 開發助手
- Codex CLI:用於規劃、編輯與快速自動化的指令列 AI 助手
- Kilo:輕量型 AI 編碼代理/助手,支援專案間的快速編輯、重構與程式碼庫問答
- OpenCode:開源、本地優先的編碼助手/代理,支援自訂工作流程與工具整合
如何在這些工作流程中使用 GLM-4.7:
- 將供應商/基礎 URL 設定為 Novita 的 OpenAI 相容端點
- 選擇模型:
zai-org/glm-4.7
最快速路徑:在 Novita AI 上體驗 GLM-4.7
如果你的目標是「今天就把 GLM-4.7 跑起來」且不想管理基礎設施,Novita AI 的無伺服器存取是最直接的路徑——特別是在你比較模型、優化花費、或需要快速上線的場景下。
Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 介面輕鬆部署 AI 模型,同時也提供高性價比、可靠的 GPU 雲端服務,用於建構與擴展 AI 應用。
常見問題
GLM-4.7 是否免費?
在 Novita AI 上,GLM-4.7 採用量計費:輸入權杖 $0.6/百萬、快取讀取 $0.11/百萬、輸出權杖 $2.2/百萬。 在 Z.ai 上,存取權通常打包在付費編碼方案中(每月 $3 起)。 部分平台可能提供有限的試用額度,但 GLM-4.7 本身並非全平台免費。
GLM-4.7 的表現真的優秀嗎?
針對編碼與自主代理工作流程,其發行方將其定位為頂級開源模型。Z.ai 表示 GLM-4.7 在編碼與代理基準測試(例如 LiveCodeBench v6、SWE-bench 驗證版、BrowseComp、τ²-Bench)中表現優異,在多項指標上可與 Claude Sonnet 4.5 競爭。
GLM-4.7 是否支援視覺功能?
GLM-4.7 僅支援文字輸入。如果你需要視覺功能,請改用 GLM-V 系列模型(例如 GLM-4.6V 或 GLM-4.5V,各供應商對圖片輸入的支援情況可能不同)。
