GLM-4.7 現已上線 Novita AI 平台,將 Z.AI 最新旗艦文字模型以生產級、OpenAI 相容的無伺服器 API 形式提供。GLM-4.7 針對自主編程、長期任務規劃和工具協作工作流進行了優化,具備更強的「思考→執行」可靠性,且前端美觀度有明顯提升,適合真實產品交付。
在 Novita AI 上,你可以運行 GLM-4.7,支援 204,800 上下文長度、最高 131,072 輸出長度、fp8 量化,以及內建對函數呼叫和結構化輸出的支援。
什麼是 GLM-4.7?
GLM-4.7 是 Z.AI 最新推出的旗艦文字模型,主要升級聚焦於進階編程能力、長程任務規劃和更可靠的工具協作——旨在端到端完成任務,而非僅生成孤立的程式碼片段。
官方核心規格:
- 上下文視窗: 200K tokens
- 最大輸出: 128K tokens
- 功能支援: 思考模式、串流輸出、函數呼叫、上下文快取、結構化輸出(JSON)、MCP 工具/資料來源整合
💡你在 Novita AI 獲得的生產級無伺服器服務:
項目 詳細資訊 模型 GLM-4.7 上下文長度 204,800 最大輸出 131,072 量化方式 fp8 函數呼叫 / 結構化輸出 支援
為什麼選擇 Novita AI 上的 GLM-4.7
透明無伺服器定價(按 token 計費)
在 Novita AI 上,GLM-4.7 以無伺服器端點形式運行,採用清晰的 per-token 計費模式:
- 輸入: $0.6 / 百萬 tokens
- 快取讀取: $0.11 / 百萬 tokens
- 輸出: $2.2 / 百萬 tokens
快取讀取這項定價非常重要:它能讓長期任務工作流(例如「智能體在大型程式碼庫/規格文件上進行多輪操作」)的成本大幅降低。點此瞭解更多定價相關資訊。
相容 OpenAI API,即刻整合
如果你已經在使用 OpenAI 風格的 Chat Completions API,只需修改 Novita 的 base URL 並切換模型名稱即可完成遷移,無需學習新的協議。
專為自主任務交付設計
Z.AI 將 GLM-4.7 定位為「任務完成型」模型,在工具使用過程中具備更強的指令遵循能力,且複雜智能體迴圈的穩定性也有顯著提升。
GLM-4.7 功能與基準測試
GLM-4.7 圍繞自主編程(端到端交付任務)、更強的可控制思考推理能力和更可靠的工具協作工作流設計,且在網頁/UI 生成品質(俗稱「氛圍編程」)上有明顯提升。
功能特性
- 端到端自主編程:在多檔案專案和真實智能體框架的規劃、實現、迭代環節表現更優。
- 思考後再執行(更穩定的智能體):提升了指令遵循能力和複雜任務穩定性,支援回合級控制,可在成本/延遲與可靠性之間取得平衡。
- 工具使用與網頁瀏覽:工具執行模式更強,瀏覽類任務表現更佳。
- 複雜推理能力提升:在難度較高的推理評估(包括工具增強場景)中取得了可量化的進步。
- 氛圍編程(UI 與簡報品質):生成的現代化網頁更簡潔,簡報/版面設計更美觀。
標準化基準測試
以下成績由 Z.AI 官方報告:
| 類別 | 基準測試 | GLM-4.7 |
| 編程(真實錯誤修復) | SWE-bench Verified | 73.8 |
| 自主/終端 | Terminal Bench 2.0 | 41.0 |
| 編程(實時) | LiveCodeBench v6 | 84.9 |
| 工具使用(互動) | τ²-Bench | 87.4 |
| 網頁瀏覽 | BrowseComp | 52.0(搭配上下文管理可達 67.5) |
| 推理(工具增強) | HLE(搭配工具) | 42.8 |

LMArena 「人類偏好」評分信號
LMArena 排名基於盲測使用者投票,是對基準測試的有益補充,能反映模型的真實使用感受。
- WebDev 排行榜: GLM-4.7 排名第 6,得分 1447(誤差範圍 ±10),共 4,833 票(最後更新於 2026 年 1 月 16 日)。
- Text 競技場(總榜): GLM-4.7 排名第 18,得分 1443(誤差範圍 ±7),共 8,258 票(最後更新於 2026 年 1 月 12 日)。
🏆開源模型定位: 在這兩個排行榜中,排名高於 GLM-4.7 的模型均為專有許可證,而 GLM-4.7 採用 MIT 許可證——這使得它在這些排行榜更新時,是 WebDev 和 Text(總榜) 中排名最高的開源許可證模型。
開始在 Novita AI 上使用 GLM-4.7
選項 A:使用 Playground
瞭解 GLM-4.7 最簡單的方式就是直接在 Novita AI Playground 中試用。你可以在 Novita AI Playground 中即時與 GLM-4.7 互動,無需任何配置、無需編寫程式碼。只需註冊帳號、打開 Playground,即可即時測試提示詞。新帳號註冊後可獲得免費額度,你可以馬上體驗模型。
選項 B:透過 API 整合
使用 Novita AI 統一的 REST API 將 GLM-4.6V 整合到你的應用程式中。
在 Novita AI 上獲取 API 金鑰
- 步驟 1:建立或登入你的帳號
造訪
[https://novita.ai](https://novita.ai)註冊新帳號或登入既有帳號 - 步驟 2:進入金鑰管理頁面 登入後,找到「API Keys」選項
- 步驟 3:建立新金鑰 點擊「Add New Key」按鈕
- 步驟 4:立即保存你的金鑰 金鑰生成後請立即複製保存;它通常只會顯示一次,後續無法再次取得。請將金鑰存放在安全的位置,例如密碼管理器或加密筆記中
直接 API 整合
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="zai-org/glm-4.7",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=131072,
temperature=0.7
)
print(response.choices[0].message.content)
使用 OpenAI Agents SDK 構建多智能體工作流
透過即插即用整合構建複雜的智能體系統——支援原生函數呼叫實現的任務交接、路由和工具使用,同時提供完整的長上下文視窗,勝任複雜多步驟任務。
選項 C:連接第三方平台
如果你已經在使用智能體框架或開發者工具構建專案,Novita AI 的設計可以實現極低成本的接入:
- 智能體框架與應用構建工具: 跟隨 Novita 的逐步整合指南,連接熱門工具如 Continue、AnythingLLM、LangChain 和 Langflow。
- Hugging Face Hub: Novita 在 Hugging Face 上被列為推理供應商,你可以透過 Hugging Face 的供應商工作流和生態系統運行受支援的模型。
- OpenAI 相容 API: Novita 的 LLM 端點相容 OpenAI API 標準,可以輕鬆遷移既有 OpenAI 風格的應用,並連接眾多 OpenAI 相容工具(Cline、Cursor、Trae 和 Qwen Code)。
- Anthropic 相容 API(Claude Code 工作流): Novita 同時提供相容 Anthropic SDK 的存取方式,你可以將 Novita 支援的模型整合到 Claude Code 風格的自主編程工作流中。
- OpenCode(內建供應商): Novita AI 現已作為受支援的供應商直接整合到 OpenCode 中,使用者無需手動配置即可在 OpenCode 中選擇 Novita。
生產環境最佳實踐
- 長期任務智能體使用提示詞快取 如果你在大型穩定上下文(程式碼庫快照、長規格文件、設計文檔)上運行多輪工作流,快取可以大幅降低成本——Novita 明確公開了快取讀取的計費價格。
- 使用結構化輸出保障流程可靠性 與工作流引擎、驗證器或 UI 整合時,優先使用 JSON 結構化輸出(基於 schema),以减少解析邊例情況。Novita 已標明 GLM-4.7 支援結構化輸出。
- 使用函數呼叫實現工具增強編程 將你的工具封裝為函數:程式碼庫搜尋、工單查詢、CI 觸發、資料庫讀取、網頁抓取等,讓模型自行判斷何時呼叫這些函數。GLM-4.7 專為更強的的工具協作能力設計。
- 思考模式策略:「預設快速,需要時深度思考」
- 簡單問答/格式化任務:關閉思考模式
- 除錯/多步驟重構任務:開啟思考模式
- 長期任務:選擇能提升穩定性和快取命中率的模式
總結
對於構建自主編程和長期工具協作工作流的開發者而言,GLM-4.7 帶來了一組實用的升級:200K 上下文、可控制思考、更強的函數呼叫行為,以及更優質的前端「氛圍編程」輸出。
在 Novita AI 上,你可以立即使用OpenAI 相容、無伺服器的 API 開始使用,享受透明的 token 計價,以及內建的函數呼叫和結構化輸出支援,可直接用於生產級智能體流程。
Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 來部署 AI 模型,同時也提供平價且可靠的 GPU 雲端服務,用於構建和擴展 AI 應用。
常見問題
什麼是 GLM-4.7? GLM-4.7 是 Z.AI 的旗艦 LLM,定位為強化編程能力、提升多步驟推理/執行穩定性的模型,並同步發佈官方開放權重版本(可在 Hugging Face 下載)。
GLM-4.7 是否免費? 在 Novita AI 上,GLM-4.7 採用按 token 計費模式:輸入 $0.6/百萬 tokens、快取讀取 $0.11/百萬 tokens、輸出 $2.2/百萬 tokens。 在 Z.ai 平台,存取權通常捆綁在付費編程方案中(每月 $3 起)。 部分平台可能會提供有限的試用額度(例如 Novita AI),但 GLM-4.7 本身並非全平台免費。
GLM-4.7 的表現真的優秀嗎? 針對編程+自主工作流場景,其發佈方將其定位為頂級開源模型。Z.AI 報告顯示,GLM-4.7 在編程和智能體基準測試(例如 LiveCodeBench v6、SWE-bench Verified、BrowseComp、τ²-Bench)中表現優異,在多項指標上可與 Claude Sonnet 4.5 競爭。

