GLM-4.7 登陸 Novita AI：透過 API 實現長上下文自主編程

什麼是 GLM-4.7？
為什麼選擇 Novita AI 上的 GLM-4.7
GLM-4.7 功能與基準測試
開始在 Novita AI 上使用 GLM-4.7
生產環境最佳實踐
總結

GLM-4.7 現已上線 Novita AI 平台，將 Z.AI 最新旗艦文字模型以生產級、OpenAI 相容的無伺服器 API 形式提供。GLM-4.7 針對自主編程、長期任務規劃和工具協作工作流進行了優化，具備更強的「思考→執行」可靠性，且前端美觀度有明顯提升，適合真實產品交付。

在 Novita AI 上，你可以運行 GLM-4.7，支援 204,800 上下文長度、最高 131,072 輸出長度、fp8 量化，以及內建對函數呼叫和結構化輸出的支援。

立即體驗 GLM 4.7！

什麼是 GLM-4.7？

GLM-4.7 是 Z.AI 最新推出的旗艦文字模型，主要升級聚焦於進階編程能力、長程任務規劃和更可靠的工具協作——旨在端到端完成任務，而非僅生成孤立的程式碼片段。

官方核心規格：

上下文視窗： 200K tokens
最大輸出： 128K tokens
功能支援： 思考模式、串流輸出、函數呼叫、上下文快取、結構化輸出（JSON）、MCP 工具/資料來源整合

💡你在 Novita AI 獲得的生產級無伺服器服務：

項目詳細資訊

模型 GLM-4.7

上下文長度 204,800

最大輸出 131,072

量化方式 fp8

函數呼叫 / 結構化輸出支援

立即體驗 GLM 4.7！


項目	詳細資訊
模型	GLM-4.7
上下文長度	204,800
最大輸出	131,072
量化方式	fp8
函數呼叫 / 結構化輸出	支援

為什麼選擇 Novita AI 上的 GLM-4.7

透明無伺服器定價（按 token 計費）

在 Novita AI 上，GLM-4.7 以無伺服器端點形式運行，採用清晰的 per-token 計費模式：

輸入： $0.6 / 百萬 tokens
快取讀取： $0.11 / 百萬 tokens
輸出： $2.2 / 百萬 tokens

快取讀取這項定價非常重要：它能讓長期任務工作流（例如「智能體在大型程式碼庫/規格文件上進行多輪操作」）的成本大幅降低。點此瞭解更多定價相關資訊。

相容 OpenAI API，即刻整合

如果你已經在使用 OpenAI 風格的 Chat Completions API，只需修改 Novita 的 base URL 並切換模型名稱即可完成遷移，無需學習新的協議。

專為自主任務交付設計

Z.AI 將 GLM-4.7 定位為「任務完成型」模型，在工具使用過程中具備更強的指令遵循能力，且複雜智能體迴圈的穩定性也有顯著提升。

GLM-4.7 功能與基準測試

GLM-4.7 圍繞自主編程（端到端交付任務）、更強的可控制思考推理能力和更可靠的工具協作工作流設計，且在網頁/UI 生成品質（俗稱「氛圍編程」）上有明顯提升。

功能特性

端到端自主編程：在多檔案專案和真實智能體框架的規劃、實現、迭代環節表現更優。
思考後再執行（更穩定的智能體）：提升了指令遵循能力和複雜任務穩定性，支援回合級控制，可在成本/延遲與可靠性之間取得平衡。
工具使用與網頁瀏覽：工具執行模式更強，瀏覽類任務表現更佳。
複雜推理能力提升：在難度較高的推理評估（包括工具增強場景）中取得了可量化的進步。
氛圍編程（UI 與簡報品質）：生成的現代化網頁更簡潔，簡報/版面設計更美觀。

標準化基準測試

以下成績由 Z.AI 官方報告：


類別	基準測試	GLM-4.7
編程（真實錯誤修復）	SWE-bench Verified	73.8
自主/終端	Terminal Bench 2.0	41.0
編程（實時）	LiveCodeBench v6	84.9
工具使用（互動）	τ²-Bench	87.4
網頁瀏覽	BrowseComp	52.0（搭配上下文管理可達 67.5）
推理（工具增強）	HLE（搭配工具）	42.8

LMArena 「人類偏好」評分信號

LMArena 排名基於盲測使用者投票，是對基準測試的有益補充，能反映模型的真實使用感受。

WebDev 排行榜： GLM-4.7 排名第 6，得分 1447（誤差範圍 ±10），共 4,833 票（最後更新於 2026 年 1 月 16 日）。
Text 競技場（總榜）： GLM-4.7 排名第 18，得分 1443（誤差範圍 ±7），共 8,258 票（最後更新於 2026 年 1 月 12 日）。

🏆開源模型定位： 在這兩個排行榜中，排名高於 GLM-4.7 的模型均為專有許可證，而 GLM-4.7 採用 MIT 許可證——這使得它在這些排行榜更新時，是 WebDev 和 Text（總榜） 中排名最高的開源許可證模型。

開始在 Novita AI 上使用 GLM-4.7

選項 A：使用 Playground

瞭解 GLM-4.7 最簡單的方式就是直接在 Novita AI Playground 中試用。你可以在 Novita AI Playground 中即時與 GLM-4.7 互動，無需任何配置、無需編寫程式碼。只需註冊帳號、打開 Playground，即可即時測試提示詞。新帳號註冊後可獲得免費額度，你可以馬上體驗模型。

前往 Playground！

選項 B：透過 API 整合

使用 Novita AI 統一的 REST API 將 GLM-4.6V 整合到你的應用程式中。

在 Novita AI 上獲取 API 金鑰

步驟 1：建立或登入你的帳號 造訪 [https://novita.ai](https://novita.ai) 註冊新帳號或登入既有帳號
步驟 2：進入金鑰管理頁面 登入後，找到「API Keys」選項
步驟 3：建立新金鑰 點擊「Add New Key」按鈕
步驟 4：立即保存你的金鑰 金鑰生成後請立即複製保存；它通常只會顯示一次，後續無法再次取得。請將金鑰存放在安全的位置，例如密碼管理器或加密筆記中

直接 API 整合

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="zai-org/glm-4.7",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=131072,
    temperature=0.7
)

print(response.choices[0].message.content)

使用 OpenAI Agents SDK 構建多智能體工作流

透過即插即用整合構建複雜的智能體系統——支援原生函數呼叫實現的任務交接、路由和工具使用，同時提供完整的長上下文視窗，勝任複雜多步驟任務。

選項 C：連接第三方平台

如果你已經在使用智能體框架或開發者工具構建專案，Novita AI 的設計可以實現極低成本的接入：

智能體框架與應用構建工具： 跟隨 Novita 的逐步整合指南，連接熱門工具如 Continue、AnythingLLM、LangChain 和 Langflow。
Hugging Face Hub： Novita 在 Hugging Face 上被列為推理供應商，你可以透過 Hugging Face 的供應商工作流和生態系統運行受支援的模型。
OpenAI 相容 API： Novita 的 LLM 端點相容 OpenAI API 標準，可以輕鬆遷移既有 OpenAI 風格的應用，並連接眾多 OpenAI 相容工具（Cline、Cursor、Trae 和 Qwen Code）。
Anthropic 相容 API（Claude Code 工作流）： Novita 同時提供相容 Anthropic SDK 的存取方式，你可以將 Novita 支援的模型整合到 Claude Code 風格的自主編程工作流中。
OpenCode（內建供應商）： Novita AI 現已作為受支援的供應商直接整合到 OpenCode 中，使用者無需手動配置即可在 OpenCode 中選擇 Novita。

生產環境最佳實踐

長期任務智能體使用提示詞快取 如果你在大型穩定上下文（程式碼庫快照、長規格文件、設計文檔）上運行多輪工作流，快取可以大幅降低成本——Novita 明確公開了快取讀取的計費價格。
使用結構化輸出保障流程可靠性 與工作流引擎、驗證器或 UI 整合時，優先使用 JSON 結構化輸出（基於 schema），以减少解析邊例情況。Novita 已標明 GLM-4.7 支援結構化輸出。
使用函數呼叫實現工具增強編程 將你的工具封裝為函數：程式碼庫搜尋、工單查詢、CI 觸發、資料庫讀取、網頁抓取等，讓模型自行判斷何時呼叫這些函數。GLM-4.7 專為更強的的工具協作能力設計。
思考模式策略：「預設快速，需要時深度思考」
- 簡單問答/格式化任務：關閉思考模式
- 除錯/多步驟重構任務：開啟思考模式
- 長期任務：選擇能提升穩定性和快取命中率的模式

總結

對於構建自主編程和長期工具協作工作流的開發者而言，GLM-4.7 帶來了一組實用的升級：200K 上下文、可控制思考、更強的函數呼叫行為，以及更優質的前端「氛圍編程」輸出。

在 Novita AI 上，你可以立即使用OpenAI 相容、無伺服器的 API 開始使用，享受透明的 token 計價，以及內建的函數呼叫和結構化輸出支援，可直接用於生產級智能體流程。

更多 GLM 4.7 相關資訊

Novita AI 是一個 AI 雲端平台，為開發者提供簡單的 API 來部署 AI 模型，同時也提供平價且可靠的 GPU 雲端服務，用於構建和擴展 AI 應用。

常見問題

什麼是 GLM-4.7？ GLM-4.7 是 Z.AI 的旗艦 LLM，定位為強化編程能力、提升多步驟推理/執行穩定性的模型，並同步發佈官方開放權重版本（可在 Hugging Face 下載）。

GLM-4.7 是否免費？ 在 Novita AI 上，GLM-4.7 採用按 token 計費模式：輸入 $0.6/百萬 tokens、快取讀取 $0.11/百萬 tokens、輸出 $2.2/百萬 tokens。在 Z.ai 平台，存取權通常捆綁在付費編程方案中（每月 $3 起）。部分平台可能會提供有限的試用額度（例如 Novita AI），但 GLM-4.7 本身並非全平台免費。

GLM-4.7 的表現真的優秀嗎？ 針對編程+自主工作流場景，其發佈方將其定位為頂級開源模型。Z.AI 報告顯示，GLM-4.7 在編程和智能體基準測試（例如 LiveCodeBench v6、SWE-bench Verified、BrowseComp、τ²-Bench）中表現優異，在多項指標上可與 Claude Sonnet 4.5 競爭。

GLM-4.7 登陸 Novita AI：透過 API 實現長上下文自主編程

什麼是 GLM-4.7？