Novita AI 推出頂尖 THUDM 模型：GLM-4 系列模型

什麼是 GLM-4 系列模型？
GLM-4-32B-0414 基準測試
GLM-4 系列能力
如何存取 GLM-4 系列模型？
結論
常見問題

Novita AI 興奮推出五款性能卓越的 THUDM 模型，在數學、程式碼方面表現優異： GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414 和 GLM-Z1-9B-0414。為支援開發者與開源社群，GLM-4-9B-0414 與 GLM-Z1-9B-0414 現已提供免費 API 使用！

Novita AI 自豪地推出五款頂級 THUDM 模型：GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414 與 GLM-Z1-9B-0414。
GLM-4-32B-0414 建構於 15T 高品質數據與人類偏好對齊之上，擁有強大的通用能力，在指令遵循、工具使用與搜尋問答方面表現卓越。
對於追求高效能或高性價比的開發者，Novita AI 現已提供 GLM-4-9B-0414 與 GLM-Z1-9B-0414 的免費 API 存取。

什麼是 GLM-4 系列模型？

THUDM 的 GLM 系列展現出強大的技術表現，尤其在數學、程式碼與推理任務上。

32B 模型（GLM-4-32B、GLM-Z1-32B、GLM-Z1-Rumination）在 通用能力 ** 與 ** 深度推理 ** 之間取得平衡，其中 GLM-Z1-Rumination 專精於 ** 開放式問題解決與搜尋增強推理。
9B 模型（GLM-4-9B、GLM-Z1-9B）針對 數學推理 ** 與 ** 通用任務表現 進行高度最佳化，實現令人印象深刻的效能-尺寸比，非常適合輕量部署。

GLM-4-32B-Base-0414 為整個系列的技術基礎。

它基於 15T 高品質數據進行預訓練，其中包含大量以推理為主的合成數據，為處理複雜任務奠定堅實基礎。
訓練後最佳化涉及 人類偏好對齊，增強模型提供自然且與使用者對齊的對話體驗。

清晰的模型分層滿足不同的開發需求。

對於 複雜推理、深度寫作與跨領域分析，建議使用 GLM-Z1-Rumination-32B。
對於 強通用效能，GLM-4-32B 是理想選擇。
對於 預算有限的專案 ** 或 ** 大規模批次作業（例如翻譯、問答），免費的 GLM-4-9B 與 GLM-Z1-9B 模型提供絕佳的性價比。

GLM-4-32B-0414 基準測試

GLM-4-32B-0414 的強項

指令遵循（IFEval）：
GLM-4-32B-0414 在指令理解與執行方面表現出色，在所有模型中獲得最高分。

工具使用能力（BFCL-v3 / TAU-Bench）：
GLM-4-32B-0414 在跨多個行業（零售、航空）的工具使用任務中展現傑出表現，在單輪與多輪場景中均領先或並列第一。
其優勢在複雜的多輪工具使用中尤為突出，超越第二名的模型近 10 分。

搜尋型問答（SimpleQA, HotpotQA）：
GLM-4-32B-0414 在搜尋問答方面展現強大能力，在 SimpleQA 中獲得最高分（88.1），在 HotpotQA 中幾乎與 GPT-4o-1120 持平，同時明顯優於 DeepSeek-V3-0324 和 Qwen2.5-Max。

GLM-4 系列能力

程式碼 VS Gemini 2.5 Flash

如何存取 GLM-4 系列模型？

步驟 1：登入並進入模型庫

登入您的帳戶，點擊 模型庫 按鈕。

立即體驗 GLM-4 展示！

步驟 2：選擇模型

瀏覽可用的選項，選擇符合您需求的模型。

步驟 3：開始免費試用

開始免費試用，探索所選模型的能力。

步驟 4：取得 API 金鑰

為了進行 API 驗證，我們將提供您一組新的 API 金鑰。進入「設定」頁面，您可以按照圖片指示複製 API 金鑰。

步驟 5：安裝 API

使用您程式語言對應的套件管理器安裝 API。

安裝完成後，在您的開發環境中匯入必要的函式庫。使用您的 API 金鑰初始化 API，開始與 Novita AI LLM 互動。以下是適用於 Python 使用者的聊天補全 API 範例。

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "thudm/glm-4-32b-0414"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

結論

GLM-4-32B-0414 在從指令遵從到複雜多輪工具使用的關鍵 AI 任務中展現卓越實力。其均衡的能力，加上經過微調的對話最佳化，使其成為需要強大、多功能模型之開發者的理想選擇。
有了 Novita AI 的支援，探索 GLM 模型變得前所未有的簡單。深入模型遊樂場，看看 GLM-4 能做些什麼。

常見問題

GLM-4-32B-0414 與其他模型相比有何特別之處？

GLM-4-32B-0414 在指令遵循、多輪工具使用及搜尋型問答方面表現突出，這得益於廣泛的預訓練與微調對話最佳化。

我可以透過 Novita AI 試用 GLM-4-32B-0414 嗎？

可以，GLM-4-32B-0414 已在 Novita AI 上提供，並提供具競爭力的 API 定價，而 GLM-4-9B 與 GLM-Z1-9B 則可免費存取。

GLM-4 系列模型最適合哪些用途？

GLM-4-32B-0414 非常適合需要深度推理、複雜對話與高精度指令執行的任務。

Novita AI 是一個 AI 雲端平台，讓開發者能透過我們簡潔的 API 輕鬆部署 AI 模型，同時提供價格實惠且可靠的 GPU 雲服務，用於建構與擴展。

Novita AI 推出頂尖 THUDM 模型：GLM-4 系列模型

什麼是 GLM-4 系列模型？

GLM-4-32B-0414 基準測試

GLM-4-32B-0414 的強項

GLM-4 系列能力

程式碼 VS Gemini 2.5 Flash

如何存取 GLM-4 系列模型？

結論

常見問題

推薦閱讀

Product

RESOURCES

Partners

Company

什麼是 GLM-4 系列模型？

GLM-4-32B-0414 基準測試

GLM-4-32B-0414 的強項

GLM-4 系列能力

程式碼 VS Gemini 2.5 Flash

如何存取 GLM-4 系列模型？

結論

常見問題

推薦閱讀

相關文章

Product

RESOURCES

Partners

Company