Z. AI 正式發布了最新旗艦模型 GLM-5。這款模型在智能效率上實現了巨大飛躍,專為複雜系統工程和長期代理任務設計。GLM-5 目前已透過 Novita AI 的 API 開放存取,你可以快速進行原型驗證,驗證可行後即可大規模部署。
這篇文章將詳細介紹 GLM-5 的定位、基準測試表現,以及如何使用它:首先透過遊樂場體驗,接著透過 API/SDK 接入,還包括開發者已經在使用的第三方平台選項。
🙌Novita AI 是 GLM-5 的官方發布合作夥伴,提供 GLM-5 首日支援。這意味著開發者可以立即透過穩定 API 存取該模型,無需管理基礎設施,也无需等待分批上線。
什麼是 GLM-5?
GLM-5 是 Z.ai 的全新旗艦基礎模型,目標是實現 代理工程(Agentic Engineering)——不僅是「寫出一個函數」,而是「上線完整功能」,包含規劃、工具使用和長期任務一致性。它專為 複雜系統工程和長期代理任務 設計,官方文件強調其在開發者工作流程中的實際編程可用性已接近前沿封閉式模型。
GLM-5 一覽
| 項目 | 詳情 |
| 組織 | Z.ai |
| 發布日期 | 2026 年 2 月 12 日 |
| 參數 | 總計 744B,激活 40B(MoE) |
| 架構 | MoE + 長上下文優化(包含 DeepSeek 稀疏注意力) |
| 上下文窗口 | 約 200K tokens |
基準測試與效能
Z.ai 的官方文件將 GLM-5 定位為從「vibe 編程」(一次性代碼生成)到 代理執行(agentic execution)(多步驟規劃 + 工具協調 + 調試迴圈)的質變。這些改進來自於模型擴充和訓練棧升級:更大的模型規模、更多的預訓練數據,以及專為提升後訓練效率設計的異步強化學習系統(「Slime」)。
對比效能分析
以下數據將 GLM-5 與其他前沿模型進行對比,包括 Claude Opus 4.5、Gemini 3 Pro 和 GPT-5.2(xhigh 版本)。

資料來源:Z.AI
關鍵發現:
- 工具使用與搜尋領先:GLM-5 在 Humanity’s Last Exam (HLE) 工具使用場景(得分 50.4)和 BrowseComp(得分 75.9)中優於所有競爭對手,表明其在管理外部上下文和執行多步驟資訊檢索方面具有更強的能力。
- 代際增長顯著:對比 GLM-4.7,GLM-5 在多項指標上實現大幅提升,尤其在 Terminal-Bench 2.0(從 41.0 提升至 56.2)和 MCP-Atlas(從 52.0 提升至 67.8)上表現突出。
- 系統工程前沿水平:在 SWE-bench Verified 和 Terminal-Bench 2.0 等編程密集型基準測試中,GLM-5 直接與 Claude Opus 4.5 競爭,證明其已具備勝任高級工程任務的能力。
- 性價比高效:雖然效能比前代更強,但 GLM-5 在 Vending Bench 2 中保持了均衡的成本表現,處理高複雜度任務時通常比 Gemini 3 Pro 或 Claude Opus 4.5 更具性價比。
CC-Bench-V2:真實世界軟體工程效能
在 CC-Bench-V2 的內部評估中,GLM-5 相比前代 GLM-4.7 實現了巨大飛躍,在生產級工程任務中已能直接與 Claude Opus 4.5 競爭,部分場景甚至實現超越。

資料來源:Z.AI
關鍵發現:
- 前端開發表現優異:在前端任務中,GLM-5 實現了 98.0% 的構建成功率,比 GLM-4.7 提升 26%,遠高於 Claude Opus 4.5 的 93.0%。其 端到端正確率(74.8%)也與 Claude Opus 4.5(75.7%)持平。
- 後端工程能力穩步提升:GLM-5 的後端正確率相比前代提升了 6.2%,得分 25.8%,幾乎追平 Claude Opus 4.5 的 26.9%。
- 長期探索能力出眾:GLM-5 的突出優勢之一是能夠在大型代碼庫中導航。在 大型代碼庫探索 任務中,GLM-5 得分 65.6%,優於 Claude Opus 4.5 的 64.5%。
快速開始:透過遊樂場互動體驗
在深入編程之前,體驗 GLM-5 能力最快的方式是透過 Novita AI 遊樂場。
遊樂場提供了無代碼的互動介面,你可以:
- 測試推理深度:開啟「思考模式」,查看模型的內部逐步推理邏輯。
- 調整參數:微調
Temperature(0.0 到 1.0)和Top_p,控制輸出的創造性與確定性。 - 上下文壓力測試:貼上長達 200K tokens 的大型文件或日誌,測試模型的記憶與理解能力。
新用戶註冊 Novita AI 帳號通常會獲得 免費試用額度,無需初始花費即可對 GLM-5 進行數十次測試。

Novita AI 遊樂場
如何在 Novita AI 上存取 GLM-5
Novita AI 提供多種方式將 GLM-5 整合到你的生產環境中,所有方案均由我們高性價比的無伺服器 GPU 基礎設施支援。
方法一:透過 API 使用 GLM-5
🎉在 Novita AI 上,GLM-5 的定價具有競爭力:每 1M 輸入 tokens 收費 1 美元,每 1M 輸出 tokens 收費 3.2 美元,透過 快取讀取 僅需 每 1M tokens 0.2 美元,可節省大量成本。
我們的 API 完全相容 OpenAI 標準,遷移只需修改基礎 URL 和 API 金鑰即可完成。
- 基礎 URL:
https://api.novita.ai/openai - 模型 ID:
zai-org/glm-5
如何取得 API 金鑰
- 步驟 1:建立或登入你的帳號:造訪
[https://novita.ai](https://novita.ai)註冊或登入。 - 步驟 2:前往金鑰管理頁面:登入後找到「API 金鑰」選項。
- 步驟 3:建立新金鑰:點擊「新增金鑰」按鈕。
- 步驟 4:立即保存你的金鑰:金鑰生成後請立即複製儲存,它只會顯示一次。

如何取得 API 金鑰
使用以下程式碼範例整合我們的 API:
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="zai-org/glm-5",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=131072,
temperature=0.7
)
print(response.choices[0].message.content)
方法二:Python SDK 整合
為了更流暢的體驗,可以使用 Novita AI Python SDK。該 SDK 支援 串流輸出 和 函數呼叫 等進階功能,是構建實時互動代理的必備工具。
方法三:第三方平台
Novita AI 上的 GLM-5 可無縫對接業界最流行的編排框架:
- 代理框架與應用構建工具:支援 Continue、AnythingLLM、LangChain 和 Langflow 的整合指南。
- Hugging Face Hub:Novita 被列為 推理供應商(Inference Provider),可透過 Hugging Face 的供應商生態系統運行支援的模型。
- OpenAI 相容工具:Novita 遵循 OpenAI API 標準,因此你可以用極小的修改將 OpenAI 風格的應用和工具(如 Cline、Cursor、Trae 和 Qwen Code)對接。
- Anthropic 相容存取:Novita 也支援 Anthropic SDK 相容整合,適配 Claude Code 風格的工作流程。
- OpenCode 與可觀測性:可直接在 OpenCode 中使用 Novita。
總結
GLM-5 印證了開源權重模型的強大實力。它結合了 744B 參數的規模,以及 MoE 和 DSA 架構的高效率,為全球最昂貴的封閉式模型提供了可行的高性能替代方案。
準備好開始你的代理工程之旅了嗎? 如果你想快速使用 GLM-5,最實用的路徑是:在遊樂場測試 GLM-5 → 透過 Novita AI 的 API 整合 → 擴展驗證可行的方案。
Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 來部署 AI 模型,同時也提供高性價比、可靠的 GPU 雲端服務,用於構建和擴展 AI 應用。
常見問題
什麼是 GLM-5?
GLM-5 是 Z.ai 最新推出的旗艦大型語言模型,專為 代理工程 設計——支援多步驟推理、工具使用、長上下文理解(最高約 200K tokens)以及複雜編程工作流程。
GLM-5 是開源的嗎?
是的。GLM-5 以開源權重的形式發布,開發者可以在寬鬆的授權條款下下載、部署和微調它。
如何使用 GLM-5?
你可以透過雲端 API(如 Novita AI 的 API)使用 GLM-5,也可以透過線上遊樂場快速測試,或是使用 vLLM 等推理框架自行部署開源權重運行。
