Novita AI 推出頂尖 THUDM 模型:GLM-4 系列模型

Novita AI 推出頂尖 THUDM 模型:GLM-4 系列模型

Novita AI 興奮推出五款性能卓越的 THUDM 模型,在數學、程式碼方面表現優異 GLM-4-32B-0414GLM-Z1-32B-0414GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414 和 GLM-Z1-9B-0414。為支援開發者與開源社群,GLM-4-9B-0414GLM-Z1-9B-0414 現已提供免費 API 使用!

Novita AI 自豪地推出五款頂級 THUDM 模型:GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414 與 GLM-Z1-9B-0414。
GLM-4-32B-0414 建構於 15T 高品質數據與人類偏好對齊之上,擁有強大的通用能力,在指令遵循、工具使用與搜尋問答方面表現卓越。
對於追求高效能或高性價比的開發者,Novita AI 現已提供 GLM-4-9B-0414GLM-Z1-9B-0414 的免費 API 存取。

什麼是 GLM-4 系列模型?

glm model

THUDM 的 GLM 系列展現出強大的技術表現,尤其在數學、程式碼與推理任務上。

  • 32B 模型(GLM-4-32B、GLM-Z1-32B、GLM-Z1-Rumination)在 通用能力 ** 與 ** 深度推理 ** 之間取得平衡,其中 GLM-Z1-Rumination 專精於 ** 開放式問題解決與搜尋增強推理
  • 9B 模型(GLM-4-9B、GLM-Z1-9B)針對 數學推理 ** 與 ** 通用任務表現 進行高度最佳化,實現令人印象深刻的效能-尺寸比,非常適合輕量部署。

GLM-4-32B-Base-0414 為整個系列的技術基礎。

  • 它基於 15T 高品質數據進行預訓練,其中包含大量以推理為主的合成數據,為處理複雜任務奠定堅實基礎。
  • 訓練後最佳化涉及 人類偏好對齊,增強模型提供自然且與使用者對齊的對話體驗。

清晰的模型分層滿足不同的開發需求。

  • 對於 複雜推理、深度寫作與跨領域分析,建議使用 GLM-Z1-Rumination-32B。
  • 對於 強通用效能,GLM-4-32B 是理想選擇。
  • 對於 預算有限的專案 ** 或 ** 大規模批次作業(例如翻譯、問答),免費的 GLM-4-9B 與 GLM-Z1-9B 模型提供絕佳的性價比。

GLM-4-32B-0414 基準測試

glm benchmark

GLM-4-32B-0414 的強項

指令遵循(IFEval):
GLM-4-32B-0414 在指令理解與執行方面表現出色,在所有模型中獲得最高分。

工具使用能力(BFCL-v3 / TAU-Bench):
GLM-4-32B-0414 在跨多個行業(零售、航空)的工具使用任務中展現傑出表現,在單輪與多輪場景中均領先或並列第一。
其優勢在複雜的多輪工具使用中尤為突出,超越第二名的模型近 10 分。

搜尋型問答(SimpleQA, HotpotQA):
GLM-4-32B-0414 在搜尋問答方面展現強大能力,在 SimpleQA 中獲得最高分(88.1),在 HotpotQA 中幾乎與 GPT-4o-1120 持平,同時明顯優於 DeepSeek-V3-0324 和 Qwen2.5-Max。

GLM-4 系列能力

程式碼 VS Gemini 2.5 Flash

如何存取 GLM-4 系列模型?

步驟 1:登入並進入模型庫

登入您的帳戶,點擊 模型庫 按鈕。

Log In and Access the Model Library

立即體驗 GLM-4 展示!

步驟 2:選擇模型

瀏覽可用的選項,選擇符合您需求的模型。

glm model on novita ai

步驟 3:開始免費試用

開始免費試用,探索所選模型的能力。

start your free trail

步驟 4:取得 API 金鑰

為了進行 API 驗證,我們將提供您一組新的 API 金鑰。進入「設定」頁面,您可以按照圖片指示複製 API 金鑰。

get api key

步驟 5:安裝 API

使用您程式語言對應的套件管理器安裝 API。

install the api

安裝完成後,在您的開發環境中匯入必要的函式庫。使用您的 API 金鑰初始化 API,開始與 Novita AI LLM 互動。以下是適用於 Python 使用者的聊天補全 API 範例。

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "thudm/glm-4-32b-0414"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  
  

結論

GLM-4-32B-0414 在從指令遵從到複雜多輪工具使用的關鍵 AI 任務中展現卓越實力。其均衡的能力,加上經過微調的對話最佳化,使其成為需要強大、多功能模型之開發者的理想選擇。
有了 Novita AI 的支援,探索 GLM 模型變得前所未有的簡單。深入模型遊樂場,看看 GLM-4 能做些什麼

常見問題

GLM-4-32B-0414 與其他模型相比有何特別之處?

GLM-4-32B-0414 在指令遵循、多輪工具使用及搜尋型問答方面表現突出,這得益於廣泛的預訓練與微調對話最佳化。

我可以透過 Novita AI 試用 GLM-4-32B-0414 嗎?

可以,GLM-4-32B-0414 已在 Novita AI 上提供,並提供具競爭力的 API 定價,而 GLM-4-9B 與 GLM-Z1-9B 則可免費存取。

GLM-4 系列模型最適合哪些用途?

GLM-4-32B-0414 非常適合需要深度推理、複雜對話與高精度指令執行的任務。

Novita AI 是一個 AI 雲端平台,讓開發者能透過我們簡潔的 API 輕鬆部署 AI 模型,同時提供價格實惠且可靠的 GPU 雲服務,用於建構與擴展。

推薦閱讀