GLM-5.1 現已上架 Novita AI,以無伺服器文字 LLM 形式提供,支援與 OpenAI 相容的聊天完成存取。模型 ID 為 zai-org/glm-5.1;標示的上下文窗口為 204,800 個 token;於 2026 年 6 月 12 日查詢時,輸入 token 定價為每百萬個 $1.38,輸出 token 定價為每百萬個 $4.4。
本指南將說明精確的模型 ID、端點、定價欄位,以及一份可直接複製到測試環境中的首次請求範例。
重點摘要
- Novita AI 將 GLM-5.1 列為無伺服器聊天模型,支援文字輸入與文字輸出。
- 對於與 OpenAI 相容的聊天完成請求,請使用
zai-org/glm-5.1。 - 模型頁面列出:204,800 token 的上下文窗口、131,072 最大輸出 token、輸入 token 每百萬 $1.38、輸出 token 每百萬 $4.4、快取讀取輸入 token 每百萬 $0.26。
- 開始在真正需要長上下文的提示上進行測試,例如程式碼審查包、遷移計畫或代理任務歷史。
什麼是 GLM-5.1?
GLM-5.1 是 Z.AI 的 GLM 系列文字模型,在 Novita AI 上架,適用於長期任務、工程工作及程式碼輔助使用場景。模型頁面將其描述為一個適用於持續執行、規劃、迭代優化以及生產級任務交付的模型。
在整合工作方面,關鍵細節包括模型 ID、端點路徑、上下文與輸出限制,以及針對長提示或長回應的定價。在 Novita AI 上,這些細節都與 zai-org/glm-5.1 模型列表及 LLM API 文件相關。
GLM-5.1 與 Novita AI 目錄中較舊的 GLM-5 條目不同。GLM-5.1 擁有自己的模型 ID、模型詳情頁面、定價及上下文大小。如果您的現有整合使用的是 zai-org/glm-5,請勿直接無聲無息地替換模型 ID。請先使用具代表性的提示、預期輸出格式及 token 成本記錄進行小型評估,然後再更改正式流量。
Novita AI 上的 GLM-5.1 API 存取
從 Novita AI 上的 GLM-5.1 模型頁面開始,確認當前的模型列表、定價、上下文大小、功能及端點選項,然後再進行部署。該模型被列為聊天模型,採用無伺服器存取,支援文字輸入與文字輸出。
對於與 OpenAI 相容的客戶端程式碼,請使用 Novita AI 聊天完成 API 文件。請求路徑為:
POST https://api.novita.ai/openai/v1/chat/completions
如果您使用 OpenAI Python SDK,請將客戶端配置為:
https://api.novita.ai/openai
然後使用 model="zai-org/glm-5.1" 調用 client.chat.completions.create(...)。
該模型條目也列出了 Anthropic 端點選項。本指南重點放在與 OpenAI 相容的聊天完成路徑,因為這是團隊改編現有 OpenAI SDK 程式碼最直接的起點。
GLM-5.1 規格與定價摘要
以下數值於 2026 年 6 月 12 日從 Novita 模型頁面及 API 文件即時查得。
| 欄位 | 詳細資料 |
|---|---|
| 顯示名稱 | GLM-5.1 |
| 模型 ID | zai-org/glm-5.1 |
| 模型類型 | 聊天 |
| 存取模式 | 無伺服器 |
| 輸入/輸出模態 | 文字輸入 / 文字輸出 |
| 與 OpenAI 相容的基礎 URL | https://api.novita.ai/openai |
| 聊天端點 | POST /v1/chat/completions |
| 列出的端點 | chat/completions、anthropic |
| 上下文窗口 | 204,800 token |
| 最大輸出 token | 131,072 token |
| 輸入定價 | 每百萬 token $1.38 |
| 輸出定價 | 每百萬 token $4.4 |
| 快取讀取輸入定價 | 每百萬 token $0.26 |
| 列出的功能標籤 | 函式呼叫、結構化輸出、推理、無伺服器 |
定價與限制可能變更。在估算成本或導正式流量之前,請重新查閱 GLM-5.1 模型頁面即時資訊,並在您自己的計算機中使用最新數值。
何時使用 GLM-5.1
當請求主要是文字內容,且模型需要足夠的上下文來推理多個檔案、日誌、需求或先前的訊息時,請使用 GLM-5.1。典型的測試包括程式碼審查包、遷移計畫、儲存庫摘要、文件整合以及代理任務歷史。
所列出的 204,800 token 上下文窗口與 131,072 token 最大輸出,為問題歷史、原始碼片段、日誌、測試輸出、架構說明及回應結構預留了空間。請將此空間用於回答所依賴的材料,而非作為傾倒所有檔案的地方。
對於正式測試,請保持提示的組織性:將需求與原始碼片段分開,清楚標示日誌與檔案,並記錄輸入與輸出的 token 數量。這樣更容易在多次模型運行之間比較成本與品質。
何時不應使用 GLM-5.1
對於短分類、簡單提取、路由或單行改寫,除非您自己的測試顯示 GLM-5.1 有明顯的品質提升,否則請從較小的模型開始。這些任務通常不需要長上下文窗口。
GLM-5.1 在 Novita AI 上被列為文字輸入、文字輸出模型。如果您的應用程式需要圖像理解、語音、圖像生成或影片生成,請選擇明確支援該模態的模型頁面與 API 系列。
如果您正在跨供應商比較 GLM-5.1,請在從其他來源複製設定之前,先查看 Novita AI 模型頁面。您在 Novita AI 整合中的模型 ID、端點路徑、上下文限制及定價,應與 Novita AI 列表及 API 文件相符。
第一步:取得您的 Novita API 金鑰
建立或開啟您的 Novita AI 帳戶,然後從 Novita AI 控制台產生 API 金鑰。將其儲存在環境變數中,而非硬編碼在原始碼檔案中:
export NOVITA_API_KEY="your_api_key_here"
對於正式應用程式,請將 API 金鑰保留在您的金鑰管理員、CI 金鑰儲存庫或部署平台的加密環境設定中。請勿將金鑰提交到儲存庫或貼到客戶端瀏覽器程式碼中。
第二步:確認模型 ID 與端點
使用此模型 ID:
zai-org/glm-5.1
在 SDK 客戶端中使用此與 OpenAI 相容的基礎 URL:
https://api.novita.ai/openai
對於直接 HTTP 請求,使用此完整端點路徑:
https://api.novita.ai/openai/v1/chat/completions
在正式部署之前,請根據 Novita AI 模型列表端點 或 GLM-5.1 模型頁面進行最終確認。此確認可確保模型 ID 仍然可用,且模型元資料仍與您的程式碼及定價備註相符。
第三步:發送您的第一個 GLM-5.1 請求
以下是使用 OpenAI SDK 風格的簡短 Python 範例:
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["NOVITA_API_KEY"],
base_url="https://api.novita.ai/openai",
)
response = client.chat.completions.create(
model="zai-org/glm-5.1",
messages=[
{
"role": "system",
"content": "您負責審查後端遷移計畫。請回傳一份包含風險、測試覆蓋率及回滾步驟的檢查清單。",
},
{
"role": "user",
"content": "為將 Python 服務從同步工作器遷移到非同步工作器建立一份遷移檢查清單。",
},
],
max_tokens=1200,
temperature=0.2,
)
print(response.choices[0].message.content)
以下是使用 cURL 的相同首次請求:
curl "https://api.novita.ai/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer ${NOVITA_API_KEY}" \
-d '{
"model": "zai-org/glm-5.1",
"messages": [
{
"role": "system",
"content": "您負責審查後端遷移計畫。請回傳一份包含風險、測試覆蓋率及回滾步驟的檢查清單。"
},
{
"role": "user",
"content": "為將 Python 服務從同步工作器遷移到非同步工作器建立一份遷移檢查清單。"
}
],
"max_tokens": 1200,
"temperature": 0.2
}'
這些範例使用了 Novita AI LLM API 文件中涵蓋的常見聊天完成欄位:model、messages、max_tokens 與 temperature。
第四步:讀取回應
對於標準的聊天完成回應,請從以下位置讀取助手訊息:
response.choices[0].message.content
當用戶端回應中提供使用資料時,請記錄 token 使用量。使用資料有助於比較提示設計、估算成本,以及識別對任務來說過於寬泛的請求。
保持首次回應格式簡單。一旦基本請求運作正常,再新增您自己的回應結構、路由邏輯、重試機制與評估檢查。模型頁面將結構化輸出與函式呼叫列為支援的功能標籤,但在將其納入正式合約之前,請在您自己的整合中驗證每個進階參數。
第五步:檢查定價、限制與常見錯誤
GLM-5.1 定價基於 token。截至 2026 年 6 月 12 日的查詢,Novita AI 模型頁面列出輸入 token 每百萬 $1.38、輸出 token 每百萬 $4.4、快取讀取輸入 token 每百萬 $0.26。如果提示包含不相關的內容,或輸出未設上限,成本會迅速上升。
整合時需要檢查的常見問題:
- 驗證錯誤:確認已設定
NOVITA_API_KEY並以Authorization: Bearer ${NOVITA_API_KEY}發送。 - 找不到模型:確認精確的模型 ID 為
zai-org/glm-5.1。 - 基礎 URL 錯誤:SDK 客戶端應使用
https://api.novita.ai/openai,而直接 HTTP 請求應調用https://api.novita.ai/openai/v1/chat/completions。 - 上下文過大:在重試之前,減少檢索的文件、日誌或原始碼檔案。
- 輸出過長:為任務設定實際的
max_tokens值,並要求有界限的回答格式。 - 自動化偏移:在真實任務上進行評估,在可能的情況下加入確定性驗證器,並對高影響的變更要求人工審查。
最終建議
當您的測試案例依賴長文字上下文,且您希望使用與 OpenAI 相容的聊天完成路徑時,請在 Novita AI 上使用 GLM-5.1。從小型評估集開始,調用 zai-org/glm-5.1,記錄 token 使用量,並將答案與您目前使用的模型進行比較。
對於短提示、簡單提取或非文字工作負載,請先選擇較小或特定模態的模型。GLM-5.1 在任務依賴較大上下文窗口或較長輸出預算時最有價值。
常見問題
GLM-5.1 在 Novita AI 上可用嗎?
是的。根據 2026 年 6 月 12 日的查詢,GLM-5.1 已列在 Novita AI 模型庫中,作為無伺服器聊天模型。
我應該為 GLM-5.1 使用哪個模型 ID?
使用 zai-org/glm-5.1。
我應該調用哪個端點?
對於與 OpenAI 相容的聊天完成,請調用 POST https://api.novita.ai/openai/v1/chat/completions。在 OpenAI SDK 客戶端中,將基礎 URL 設為 https://api.novita.ai/openai。
GLM-5.1 在 Novita AI 上的費用是多少?
根據 2026 年 6 月 12 日的查詢,Novita AI 將 GLM-5.1 定價為輸入 token 每百萬 $1.38,輸出 token 每百萬 $4.4。模型頁面還列出快取讀取輸入定價為每百萬 token $0.26。
GLM-5.1 的上下文與輸出限制是多少?
Novita AI 模型頁面列出 GLM-5.1 的上下文窗口為 204,800 token,最大輸出 token 為 131,072。
GLM-5.1 支援函式呼叫或結構化輸出嗎?
Novita AI 模型頁面將函式呼叫與結構化輸出列為 GLM-5.1 的功能標籤。在依賴正式環境中的進階行為之前,請在您自己的整合中驗證確切的請求欄位。
GLM-5.1 與 Novita AI 上的 GLM-5 有何不同?
GLM-5.1 與 GLM-5 是兩個不同的 Novita AI 模型條目,擁有不同的模型 ID、價格、上下文數值及目錄狀態。使用 zai-org/glm-5.1 代表 GLM-5.1,使用 zai-org/glm-5 代表 GLM-5。
