GLM-4.7 登陸 Novita AI:透過 API 實現長上下文自主編程

GLM-4.7 登陸 Novita AI:透過 API 實現長上下文自主編程

GLM-4.7 現已上線 Novita AI 平台,將 Z.AI 最新旗艦文字模型以生產級、OpenAI 相容的無伺服器 API 形式提供。GLM-4.7 針對自主編程長期任務規劃工具協作工作流進行了優化,具備更強的「思考→執行」可靠性,且前端美觀度有明顯提升,適合真實產品交付。

Novita AI 上,你可以運行 GLM-4.7,支援 204,800 上下文長度、最高 131,072 輸出長度fp8 量化,以及內建對函數呼叫結構化輸出的支援。

立即體驗 GLM 4.7!

什麼是 GLM-4.7?

GLM-4.7 是 Z.AI 最新推出的旗艦文字模型,主要升級聚焦於進階編程能力長程任務規劃更可靠的工具協作——旨在端到端完成任務,而非僅生成孤立的程式碼片段。

官方核心規格:

  • 上下文視窗: 200K tokens
  • 最大輸出: 128K tokens
  • 功能支援: 思考模式、串流輸出、函數呼叫、上下文快取、結構化輸出(JSON)、MCP 工具/資料來源整合

💡你在 Novita AI 獲得的生產級無伺服器服務:

項目 詳細資訊
模型 GLM-4.7
上下文長度 204,800
最大輸出 131,072
量化方式 fp8
函數呼叫 / 結構化輸出 支援

立即體驗 GLM 4.7!

為什麼選擇 Novita AI 上的 GLM-4.7

透明無伺服器定價(按 token 計費)

在 Novita AI 上,GLM-4.7 以無伺服器端點形式運行,採用清晰的 per-token 計費模式:

  • 輸入: $0.6 / 百萬 tokens
  • 快取讀取: $0.11 / 百萬 tokens
  • 輸出: $2.2 / 百萬 tokens

快取讀取這項定價非常重要:它能讓長期任務工作流(例如「智能體在大型程式碼庫/規格文件上進行多輪操作」)的成本大幅降低。點此瞭解更多定價相關資訊。

相容 OpenAI API,即刻整合

如果你已經在使用 OpenAI 風格的 Chat Completions API,只需修改 Novita 的 base URL 並切換模型名稱即可完成遷移,無需學習新的協議。

專為自主任務交付設計

Z.AI 將 GLM-4.7 定位為「任務完成型」模型,在工具使用過程中具備更強的指令遵循能力,且複雜智能體迴圈的穩定性也有顯著提升。

GLM-4.7 功能與基準測試

GLM-4.7 圍繞自主編程(端到端交付任務)、更強的可控制思考推理能力和更可靠的工具協作工作流設計,且在網頁/UI 生成品質(俗稱「氛圍編程」)上有明顯提升。

功能特性

  • 端到端自主編程:在多檔案專案和真實智能體框架的規劃、實現、迭代環節表現更優。
  • 思考後再執行(更穩定的智能體):提升了指令遵循能力和複雜任務穩定性,支援回合級控制,可在成本/延遲與可靠性之間取得平衡。
  • 工具使用與網頁瀏覽:工具執行模式更強,瀏覽類任務表現更佳。
  • 複雜推理能力提升:在難度較高的推理評估(包括工具增強場景)中取得了可量化的進步。
  • 氛圍編程(UI 與簡報品質):生成的現代化網頁更簡潔,簡報/版面設計更美觀。

標準化基準測試

以下成績由 Z.AI 官方報告:

類別 基準測試 GLM-4.7
編程(真實錯誤修復) SWE-bench Verified 73.8
自主/終端 Terminal Bench 2.0 41.0
編程(實時) LiveCodeBench v6 84.9
工具使用(互動) τ²-Bench 87.4
網頁瀏覽 BrowseComp 52.0(搭配上下文管理可達 67.5)
推理(工具增強) HLE(搭配工具) 42.8

標題為「LLM 效能評估:自主、推理與編程」的基準測試圖表,對比 GLM-4.7 與 GLM-4.6、DeepSeek-V3.2、Claude Sonnet 4.5、GPT-5.1(High)在 128K 上下文下的八項基準測試(AIME 25、LiveCodeBench v6、GPQA-Diamond、HLE、SWE-bench Verified、Terminal Bench 2.0、τ²-Bench、BrowseComp)表現;GLM-4.7 在 SWE-bench Verified(73.8)、Terminal Bench 2.0(41.0)、τ²-Bench(87.4)上領先,搭配工具的 HLE 得分為 42.8。

LMArena 「人類偏好」評分信號

LMArena 排名基於盲測使用者投票,是對基準測試的有益補充,能反映模型的真實使用感受。

  • WebDev 排行榜: GLM-4.7 排名第 6,得分 1447(誤差範圍 ±10),共 4,833 票(最後更新於 2026 年 1 月 16 日)。
  • Text 競技場(總榜): GLM-4.7 排名第 18,得分 1443(誤差範圍 ±7),共 8,258 票(最後更新於 2026 年 1 月 12 日)。

🏆開源模型定位: 在這兩個排行榜中,排名高於 GLM-4.7 的模型均為專有許可證,而 GLM-4.7 採用 MIT 許可證——這使得它在這些排行榜更新時,是 WebDevText(總榜) 中排名最高的開源許可證模型

開始在 Novita AI 上使用 GLM-4.7

選項 A:使用 Playground

瞭解 GLM-4.7 最簡單的方式就是直接在 Novita AI Playground 中試用。你可以在 Novita AI Playground 中即時與 GLM-4.7 互動,無需任何配置、無需編寫程式碼。只需註冊帳號、打開 Playground,即可即時測試提示詞。新帳號註冊後可獲得免費額度,你可以馬上體驗模型。

前往 Playground!

選項 B:透過 API 整合

使用 Novita AI 統一的 REST API 將 GLM-4.6V 整合到你的應用程式中。

在 Novita AI 上獲取 API 金鑰

  • 步驟 1:建立或登入你的帳號 造訪 [https://novita.ai](https://novita.ai) 註冊新帳號或登入既有帳號
  • 步驟 2:進入金鑰管理頁面 登入後,找到「API Keys」選項
  • 步驟 3:建立新金鑰 點擊「Add New Key」按鈕
  • 步驟 4:立即保存你的金鑰 金鑰生成後請立即複製保存;它通常只會顯示一次,後續無法再次取得。請將金鑰存放在安全的位置,例如密碼管理器或加密筆記中

直接 API 整合

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="zai-org/glm-4.7",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=131072,
    temperature=0.7
)

print(response.choices[0].message.content) 

使用 OpenAI Agents SDK 構建多智能體工作流

透過即插即用整合構建複雜的智能體系統——支援原生函數呼叫實現的任務交接、路由和工具使用,同時提供完整的長上下文視窗,勝任複雜多步驟任務。

選項 C:連接第三方平台

如果你已經在使用智能體框架或開發者工具構建專案,Novita AI 的設計可以實現極低成本的接入:

  • 智能體框架與應用構建工具: 跟隨 Novita 的逐步整合指南,連接熱門工具如 ContinueAnythingLLMLangChainLangflow
  • Hugging Face Hub: Novita 在 Hugging Face 上被列為推理供應商,你可以透過 Hugging Face 的供應商工作流和生態系統運行受支援的模型。
  • OpenAI 相容 API: Novita 的 LLM 端點相容 OpenAI API 標準,可以輕鬆遷移既有 OpenAI 風格的應用,並連接眾多 OpenAI 相容工具(ClineCursor、Trae 和 Qwen Code)。
  • Anthropic 相容 API(Claude Code 工作流): Novita 同時提供相容 Anthropic SDK 的存取方式,你可以將 Novita 支援的模型整合到 Claude Code 風格的自主編程工作流中。
  • OpenCode(內建供應商): Novita AI 現已作為受支援的供應商直接整合到 OpenCode 中,使用者無需手動配置即可在 OpenCode 中選擇 Novita。

生產環境最佳實踐

  1. 長期任務智能體使用提示詞快取 如果你在大型穩定上下文(程式碼庫快照、長規格文件、設計文檔)上運行多輪工作流,快取可以大幅降低成本——Novita 明確公開了快取讀取的計費價格。
  2. 使用結構化輸出保障流程可靠性 與工作流引擎、驗證器或 UI 整合時,優先使用 JSON 結構化輸出(基於 schema),以减少解析邊例情況。Novita 已標明 GLM-4.7 支援結構化輸出。
  3. 使用函數呼叫實現工具增強編程 將你的工具封裝為函數:程式碼庫搜尋、工單查詢、CI 觸發、資料庫讀取、網頁抓取等,讓模型自行判斷何時呼叫這些函數。GLM-4.7 專為更強的的工具協作能力設計。
  4. 思考模式策略:「預設快速,需要時深度思考」
    • 簡單問答/格式化任務:關閉思考模式
    • 除錯/多步驟重構任務:開啟思考模式
    • 長期任務:選擇能提升穩定性和快取命中率的模式

總結

對於構建自主編程長期工具協作工作流的開發者而言,GLM-4.7 帶來了一組實用的升級:200K 上下文、可控制思考、更強的函數呼叫行為,以及更優質的前端「氛圍編程」輸出。

在 Novita AI 上,你可以立即使用OpenAI 相容無伺服器API 開始使用,享受透明的 token 計價,以及內建的函數呼叫和結構化輸出支援,可直接用於生產級智能體流程。

更多 GLM 4.7 相關資訊

Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 來部署 AI 模型,同時也提供平價且可靠的 GPU 雲端服務,用於構建和擴展 AI 應用。

常見問題

什麼是 GLM-4.7? GLM-4.7 是 Z.AI 的旗艦 LLM,定位為強化編程能力、提升多步驟推理/執行穩定性的模型,並同步發佈官方開放權重版本(可在 Hugging Face 下載)。

GLM-4.7 是否免費? 在 Novita AI 上,GLM-4.7 採用按 token 計費模式:輸入 $0.6/百萬 tokens、快取讀取 $0.11/百萬 tokens、輸出 $2.2/百萬 tokens。 在 Z.ai 平台,存取權通常捆綁在付費編程方案中(每月 $3 起)。 部分平台可能會提供有限的試用額度(例如 Novita AI),但 GLM-4.7 本身並非全平台免費。

GLM-4.7 的表現真的優秀嗎? 針對編程+自主工作流場景,其發佈方將其定位為頂級開源模型。Z.AI 報告顯示,GLM-4.7 在編程和智能體基準測試(例如 LiveCodeBench v6、SWE-bench Verified、BrowseComp、τ²-Bench)中表現優異,在多項指標上可與 Claude Sonnet 4.5 競爭。