如何存取 GLM 4.5:中國最新自主代理 AI 模型實用指南

如何存取 GLM 4.5:中國最新自主代理 AI 模型實用指南

本文旨在協助您了解 GLM 4.5 的獨特之處,更重要的是,教您如何存取並開始在專案中使用它。 無論您是尋找簡單入門點的初學者,還是希望透過 API 或本地部署進行更深層整合的開發者,本指南都會帶您了解所有可用的選項。閱讀完畢後,您將掌握實用步驟,在自己的工作流程中充分發揮 GLM-4.5 的潛力。

什麼是 GLM 4.5?

GLM-4.5 是 GLM 系列的最新成果,基於先進的混合專家(MoE)架構構建,並針對自主代理應用場景進行了特別優化。該模型有兩個版本:

  • GLM-4.5(旗艦版):
    總參數量達 3550 億,活躍參數量為 320 億。
  • GLM-4.5-Air(高效版):
    總參數量達 1060 億,活躍參數量為 120 億。

GLM 4.5 的關鍵架構創新

  • 更深的模型結構:
    • 縮減模型寬度(更小的隱藏層維度、更少的專家數量),同時增加深度(更多層),以實現更優異的推理能力。
  • 大規模語料庫預訓練:
    • 模型在包含 15 兆 token 的龐大通用語料庫上進行預訓練,確保知識覆蓋範圍廣泛且全面。
  • 開源強化學習(RL)基礎設施(「slime」):
    • 一個高度靈活、高效且可擴展的強化學習平台,專為大規模自主代理強化學習任務設計。
  • 專用強化學習階段:
    • 採用專屬的 RL 訓練階段,培養適用於進階推理與代理任務(如編程、資訊檢索、通用工具使用)的專家模型。
  • 強化資訊檢索問答:
    • 透過引入人機協作策略與內容混淆技術,提升資訊檢索類問答的表現。
  • 技能整合:
    • 將透過強化學習與監督學習獲得的知識與技能提煉為單一穩健的專家模型,在各類任務中都能展現強勁且全面的表現。

GLM 4.5 最適合的任務與基準測試

glm 4.5 benchmark

資料來源:Z.AI

自主代理任務

GLM 4.5 專為自主代理應用場景優化:

  • 原生函式呼叫能力,無需外部編排
  • 網頁瀏覽與多輪工具使用
  • 自主任務規劃與執行
  • 可與 Claude Code、Roo Code、Trae 等編程框架整合

glm 4.5 agent benchmark

編程與軟體開發

該模型展現出卓越的編程能力:

  • 全端網頁開發(前端、後端、資料庫管理)
  • 從零開始生成程式碼,以及除錯現有專案
  • 終端機操作與命令列介面任務
  • 算法實現與優化
  • 解決真實世界軟體工程問題

glm 4.5 code benchmark

GLM-4.5 的編程能力與多款領先模型在各種編程任務上進行了對比評估。測試在受控環境中按照一致的標準執行,結果顯示 GLM-4.5 表現穩定且具有競爭力,尤其在工具使用方面,其平均成功率在所有測試模型中位居第一。

glm 4.5 with agentic coding

資料來源:Z.AI

glm 4.5 tool calling and token usage

資料來源:Z.AI

複雜推理

GLM-4.5 在複雜推理任務上表現優異:

  • 數學問題解決(AIME、MATH 基準測試)
  • 科學推理與分析
  • 邏輯問題解決與多步推理
  • 長文本理解與分析

glm 4.5 reasoning benchmark

那麼,GLM 4.5 適合初學者開發者嗎?

1. 開發工具整合

  • 與熱門工具無縫相容:支援 Claude Code、Roo Code 等工具
  • 命令列學習:內建終端機操作支援
  • 資料庫支援:協助管理全端專案中的資料庫

2. 用自然語言編程

  • 自然語言編程:只需描述您想要的功能,GLM 就會生成對應的程式碼
  • 範例:「建立一個 BMI 計算網頁」—— 它可以同時生成前端與後端程式碼

3. 解釋程式碼與修復錯誤

  • 程式碼解釋:GLM 會說明每一行程式碼的作用
  • 除錯協助:如果出現錯誤,它會解釋問題原因與修復方式

如何存取 GLM 4.5?

GLM 4.5 提供多種存取方式,滿足不同使用者的需求與技術要求:

1. 網頁介面(最適合初學者)

try glm 4.5 in website

立即試用 GLM 4.5

2. API 存取(適合開發者)

Novita AI 提供的 API 支援 131K 上下文長度,輸入費用為 0.6 美元,輸出費用為 2.2 美元,能充分發揮 GLM 4.5 程式碼代理的潛力。

Novita AI

步驟 1:登入並進入模型庫

登入您的帳號,點擊 模型庫 按鈕。

Log In and Access the Model Library

步驟 2:選擇模型

瀏覽可用的選項,選擇符合您需求的模型。

choose your model

步驟 3:開始免費試用

開始免費試用,探索所選模型的能力。

start your free trail of glm 4.5

步驟 4:取得 API 金鑰

要進行 API 驗證,我們會為您提供新的 API 金鑰。進入「設定」頁面,即可按照圖片指示複製 API 金鑰。

get api key

步驟 5:安裝 API

使用對應程式語言的套件管理器安裝 API。安裝完成後,將必要的函式庫匯入您的開發環境,使用 API 金鑰初始化 API,即可開始與 Novita AI LLM 互動。以下為 Python 使用者使用聊天補全 API 的範例:

立即試用 GLM 4.5

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_UsudmdAIggvSInjIdO2HWaTCyXxTFOXDV8TH8UCPbA576Rs4AGqSA5ThNbelSDgdEGAWQcWXnAU2bHi5BueceA==",
)

model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

3. 本地部署(進階使用者)

需求:

  • GLM-4.5:需要大量的 GPU 資源(約需 700B 顯存)
  • GLM-4.5-Air:16GB 顯存(INT4 量化後僅需 12GB)

安裝步驟:

  1. HuggingFace 或 ModelScope 下載模型權重
  2. 選擇推理框架:支援 vLLM 或 SGLang
  3. 按照官方 GitHub 儲存庫中的部署指南操作

4. 整合

使用 Trae、Claude Code、Qwen Code 等 CLI 工具

如果您想在本地環境或 IDE 中使用 Novita AI 的頂尖模型(如 Qwen3-Coder、Kimi K2、DeepSeek R1)獲取 AI 編程協助,流程非常簡單:取得 API 金鑰、安裝工具、設定環境變數,即可開始編程。

詳細的設定指令與範例請參考官方教學:

使用 OpenAI Agents SDK 構建多代理工作流程

透過將 Novita AI 與 OpenAI Agents SDK 整合,構建進階多代理系統:

  • 即插即用:在任何 OpenAI Agents 工作流程中使用 Novita AI 的 LLM
  • 支援交接、路由與工具使用:設計能委派任務、分流處理或執行函式的代理,全部由 Novita AI 的模型驅動
  • Python 整合:只需將 SDK 端點設定為 https://api.novita.ai/v3/openai,並使用您的 API 金鑰即可

在第三方平台上連接 API

OpenAI 相容 API: 無縫遷移與整合,支援 ClineCursor 等符合 OpenAI API 標準的工具。

Hugging Face: 透過 Novita AI 端點,在 Hugging Face Spaces、pipeline 或 Transformers 函式庫中使用模型。

代理與編排框架: 透過官方連接器與逐步整合指南,輕鬆將 Novita AI 與合作夥伴平台如 ContinueAnythingLLM,LangChainDifyLangflow 連接。

GLM 4.5 是一款功能強大、用途廣泛的 AI 模型,適用於自主代理、編程與複雜推理場景,是中國 AI 生態系統的重大突破。從簡單的網頁介面到 API 與本地部署,GLM-4.5 提供了多種存取選項,適合從初學者到進階開發者的所有人群。其優異的表現與靈活的整合能力,是構建智慧自主解決方案的絕佳選擇。

常見問題

誰適合使用 GLM 4.5?

GLM-4.5 非常適合尋求進階 AI 代理能力的開發者、研究人員與企業,尤其適用於編程、自動化與知識處理類任務。

本地執行 GLM 4.5 的硬體需求是什麼?

旗艦版需要大量的 GPU 資源,Air 版本則可在僅有 12GB 顯存的 GPU 上執行(需使用 INT4 量化)。

初學者該如何試用 GLM 4.5?

只需使用網頁介面即可,無需安裝或編程經驗。

Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 介面,方便部署 AI 模型,同時也提供實惠且可靠的 GPU 雲端服務,用於構建與擴展 AI 應用。

推薦閱讀