Novita AI 興奮推出五款性能卓越的 THUDM 模型,在數學、程式碼方面表現優異 : GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414 和 GLM-Z1-9B-0414。為支援開發者與開源社群,GLM-4-9B-0414 與 GLM-Z1-9B-0414 現已提供免費 API 使用!
Novita AI 自豪地推出五款頂級 THUDM 模型:GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414 與 GLM-Z1-9B-0414。
GLM-4-32B-0414 建構於 15T 高品質數據與人類偏好對齊之上,擁有強大的通用能力,在指令遵循、工具使用與搜尋問答方面表現卓越。
對於追求高效能或高性價比的開發者,Novita AI 現已提供 GLM-4-9B-0414 與 GLM-Z1-9B-0414 的免費 API 存取。
什麼是 GLM-4 系列模型?

THUDM 的 GLM 系列展現出強大的技術表現,尤其在數學、程式碼與推理任務上。
- 32B 模型(GLM-4-32B、GLM-Z1-32B、GLM-Z1-Rumination)在 通用能力 ** 與 ** 深度推理 ** 之間取得平衡,其中 GLM-Z1-Rumination 專精於 ** 開放式問題解決與搜尋增強推理。
- 9B 模型(GLM-4-9B、GLM-Z1-9B)針對 數學推理 ** 與 ** 通用任務表現 進行高度最佳化,實現令人印象深刻的效能-尺寸比,非常適合輕量部署。
GLM-4-32B-Base-0414 為整個系列的技術基礎。
- 它基於 15T 高品質數據進行預訓練,其中包含大量以推理為主的合成數據,為處理複雜任務奠定堅實基礎。
- 訓練後最佳化涉及 人類偏好對齊,增強模型提供自然且與使用者對齊的對話體驗。
清晰的模型分層滿足不同的開發需求。
- 對於 複雜推理、深度寫作與跨領域分析,建議使用 GLM-Z1-Rumination-32B。
- 對於 強通用效能,GLM-4-32B 是理想選擇。
- 對於 預算有限的專案 ** 或 ** 大規模批次作業(例如翻譯、問答),免費的 GLM-4-9B 與 GLM-Z1-9B 模型提供絕佳的性價比。
GLM-4-32B-0414 基準測試

GLM-4-32B-0414 的強項
指令遵循(IFEval):
GLM-4-32B-0414 在指令理解與執行方面表現出色,在所有模型中獲得最高分。
工具使用能力(BFCL-v3 / TAU-Bench):
GLM-4-32B-0414 在跨多個行業(零售、航空)的工具使用任務中展現傑出表現,在單輪與多輪場景中均領先或並列第一。
其優勢在複雜的多輪工具使用中尤為突出,超越第二名的模型近 10 分。
搜尋型問答(SimpleQA, HotpotQA):
GLM-4-32B-0414 在搜尋問答方面展現強大能力,在 SimpleQA 中獲得最高分(88.1),在 HotpotQA 中幾乎與 GPT-4o-1120 持平,同時明顯優於 DeepSeek-V3-0324 和 Qwen2.5-Max。
GLM-4 系列能力
程式碼 VS Gemini 2.5 Flash
如何存取 GLM-4 系列模型?
步驟 1:登入並進入模型庫
登入您的帳戶,點擊 模型庫 按鈕。

步驟 2:選擇模型
瀏覽可用的選項,選擇符合您需求的模型。

步驟 3:開始免費試用
開始免費試用,探索所選模型的能力。

步驟 4:取得 API 金鑰
為了進行 API 驗證,我們將提供您一組新的 API 金鑰。進入「設定」頁面,您可以按照圖片指示複製 API 金鑰。

步驟 5:安裝 API
使用您程式語言對應的套件管理器安裝 API。

安裝完成後,在您的開發環境中匯入必要的函式庫。使用您的 API 金鑰初始化 API,開始與 Novita AI LLM 互動。以下是適用於 Python 使用者的聊天補全 API 範例。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "thudm/glm-4-32b-0414"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
結論
GLM-4-32B-0414 在從指令遵從到複雜多輪工具使用的關鍵 AI 任務中展現卓越實力。其均衡的能力,加上經過微調的對話最佳化,使其成為需要強大、多功能模型之開發者的理想選擇。
有了 Novita AI 的支援,探索 GLM 模型變得前所未有的簡單。深入模型遊樂場,看看 GLM-4 能做些什麼。
常見問題
GLM-4-32B-0414 與其他模型相比有何特別之處?
GLM-4-32B-0414 在指令遵循、多輪工具使用及搜尋型問答方面表現突出,這得益於廣泛的預訓練與微調對話最佳化。
我可以透過 Novita AI 試用 GLM-4-32B-0414 嗎?
可以,GLM-4-32B-0414 已在 Novita AI 上提供,並提供具競爭力的 API 定價,而 GLM-4-9B 與 GLM-Z1-9B 則可免費存取。
GLM-4 系列模型最適合哪些用途?
GLM-4-32B-0414 非常適合需要深度推理、複雜對話與高精度指令執行的任務。
Novita AI 是一個 AI 雲端平台,讓開發者能透過我們簡潔的 API 輕鬆部署 AI 模型,同時提供價格實惠且可靠的 GPU 雲服務,用於建構與擴展。
