Novita AI 上的 Qwen3.7-Max:適用於長上下文工作流程的代理式編碼
Qwen3.7-Max 現已透過 Novita AI 的無伺服器 API 提供,供開發者建構代理式編碼系統、長上下文助手以及使用工具的文字工作流程。在 Novita AI 模型頁面上,端點列為 qwen/qwen3-max,因此在呼叫 API 時請使用此模型 ID,即使您的文章、路線圖或發布說明中將 Qwen3.7-Max 稱為產品名稱。
此模型對代理建構者而言至關重要,因為 Qwen 的發布資料強調了倉庫編輯、終端機風格任務、規劃、指令遵循以及長時間自主執行。實際的重點現在很明確:團隊可以透過 Novita AI 的相容 OpenAI 無伺服器 API 測試此模型,然後評估其以代理為中心的行為是否能改善他們自己的編碼與自動化工作流程。
從 Novita AI 上的 Qwen3 Max 模型頁面 開始,或透過 Novita AI 相容 OpenAI 的 API 連接。請將定價、上下文限制和模型 ID 與您在生產環境中使用的 Novita AI 列表保持一致。
Qwen3.7-Max 在 Novita AI 上的可用性
Novita AI 將 Qwen3 Max 列為模型 ID qwen/qwen3-max,並說明可透過 Novita 的無伺服器 API 使用。模型頁面上的 API 範例使用相容 OpenAI 的基礎 URL https://api.novita.ai/openai 和模型值 qwen/qwen3-max。
| 可用性項目 | Novita AI 列表 |
|---|---|
| Novita 模型頁面標題 | Qwen3 Max |
| API 呼叫的模型 ID | qwen/qwen3-max |
| 存取路徑 | Novita AI 無伺服器 API |
| API 基礎 URL | https://api.novita.ai/openai |
| 輸入能力 | 文字 |
| 輸出能力 | 文字 |
| 模型頁面 | Novita AI 上的 Qwen3 Max |
最後驗證時間:2026-05-22,來自 Novita AI 模型頁面。
Qwen 的外部發布資料也討論了 Bailian 可用性、區域部署模式、Anthropic API 相容性、Responses API 工具、思考與非思考模式,以及用於長時間代理任務的 preserve_thinking。請將這些視為發布和提供者背景資訊。對於此 Novita AI 端點,請以 Novita 模型頁面作為模型 ID、無伺服器 API 路徑、限制和定價的權威來源。
Novita AI 端點規格
Novita AI 端點適合需要大型上下文視窗、結構化回應和工具相容輸出的文字優先代理工作流程。列出的上下文長度為 262144 個 token,最大輸出為 65536 個 token。
| 規格 | Novita AI 上的 Qwen3 Max |
|---|---|
| 提供者 | Qwen |
| 量化 | fp8 |
| 上下文長度 | 262144 |
| 最大輸出 | 65536 |
| 無伺服器 | 支援 |
| 函數呼叫 | 支援 |
| 結構化輸出 | 支援 |
| 輸入 / 輸出能力 | 文字 / 文字 |
最後驗證時間:2026-05-22,來自 Novita AI 模型頁面。
部分 Qwen 發布資料描述了 Qwen3.7-Max 的 100 萬 token 上下文視窗。這是發布資料的宣稱,不應視為目前 Novita AI 端點的限制。對於 Novita AI 的使用和成本規劃,列出的端點上下文長度為 262144 個 token。
如何透過 Novita AI 呼叫 Qwen3.7-Max
Novita AI 透過相容 OpenAI 的介面公開此模型。關鍵的實作細節是模型 ID:請呼叫 qwen/qwen3-max,而不是根據 Qwen3.7-Max 發布標籤猜測的端點名稱。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="YOUR_NOVITA_API_KEY",
)
response = client.chat.completions.create(
model="qwen/qwen3-max",
messages=[
{"role": "system", "content": "你是一位細心的編碼助手。"},
{"role": "user", "content": "總結失敗的測試並建議修復方案。"},
],
max_tokens=4096,
temperature=0.2,
)
print(response.choices[0].message.content)
對於生產環境的代理工作流程,請為輸出 token、工具呼叫次數、執行時間和重試行為設定單獨的上限。65536 個 token 的最大輸出為長推理軌跡或詳細編輯提供了空間,但大多數編碼代理任務仍受益於有邊界的回應和明確的驗證步驟。
Novita AI 的 Qwen3 Max 定價
Novita AI 列出了每百萬 token 的標題定價以及按輸入長度分層的定價。請使用 Novita AI 模型頁面進行 Novita 的計費決策;Qwen 或阿里雲的定價可作為外部提供者背景資訊,但不應混入 Novita AI 的定價表中。
| 輸入長度 | 輸入價格 | 輸出價格 |
|---|---|---|
| 1 到 32767 個 token | $0.845 / 百萬 token | $3.38 / 百萬 token |
| 32768 到 131071 個 token | $1.40 / 百萬 token | $5.64 / 百萬 token |
| 131072 到 258047 個 token | $2.11 / 百萬 token | $8.45 / 百萬 token |
最後驗證時間:2026-05-22,來自 Novita 模型頁面。模型頁面也列出了標題輸入/輸出定價為 $2.11 / 百萬 token 和 $8.45 / 百萬 token。
分層定價對代理式編碼很重要,因為長倉庫上下文、重複的工具摘要和冗長的輸出可能會將請求推入更高的層級。在擴展使用量之前,請使用真實的上下文打包、檢索和輸出限制來測試代表性任務,以便測量到的成本反映您的實際架構。
為什麼 Qwen3.7-Max 對代理式編碼很重要
編碼代理不再局限於簡短的程式碼補全提示。它們閱讀問題討論串、檢查倉庫、執行命令、處理錯誤、修改檔案,並透過測試或人工審查驗證結果。在這種情況下,模型需要在長上下文中維持指令、可靠地選擇工具,並在中間步驟失敗時恢復。
Qwen 的發布資料強調了代理式編碼和工具使用基準,例如 Terminal-Bench 2.0 Terminus 72.3、SWE-Pro 60.4、SWE-Multilingual 78.4、NL2Repo 47.3、SciCode 52.7、MCP-Mark 64.6、Deep-Planning 63.1、GPQA Diamond 92.2、IFBench 81.2 和 SpreadSheetBench 84.5。這些是有用的方向性訊號,但應視為 Qwen 報告的發布基準,而非對私有程式碼庫的保證。
更好的評估模式是從您自己的工作建立一個私有任務集:失敗的測試、依賴項升級、錯誤修復、帶有驗收標準的重構、與文件相關的變更,以及大量使用工具的自動化流程。在相同的架構、超時、檢索設定和審查標準下,透過 Novita AI 執行 Qwen3.7-Max,與您目前的基準進行比較。
適合的使用案例
當工作負載是文字優先、上下文密集且面向工具時,Novita AI 上的 Qwen3.7-Max 是一個強有力的候選方案。該端點的結構化輸出和函數呼叫支援使其特別適用於需要可預測的中間資料或工具引數的代理框架。
- 倉庫級別的編碼代理:檢查檔案、提出修補程式,並對測試結果進行推理。
- 長上下文工程助手:總結問題歷史、拉取請求回饋和原始碼檔案。
- 辦公室和資料自動化代理:結合提取、試算表邏輯和結構化輸出。
- 研究助手:需要文字提取、規劃和多步驟綜合。
- 工具呼叫系統:函數呼叫和結構化輸出是核心需求。
它並非原生影像或影片理解的首選,因為 Novita AI 列表顯示為文字輸入和文字輸出。對於簡單的提取、分類或路由任務,如果較小且成本較低的模型能達到品質標準,使用此模型可能過於龐大。
團隊應如何評估
使用任務級別指標(而非提示印象)來評估 Qwen3.7-Max。對於編碼代理,追蹤完成率、測試通過率、審查介入率、工具呼叫次數、實際時間、輸入 token、輸出 token 和回歸率。對於業務自動化代理,追蹤提取準確性、結構有效性、下游接受度和人工修正時間。
- 選擇 20 到 50 個代表您目標代理工作負載的真實任務。
- 固定架構、工具、檢索設定、超時和重試策略。
- 在相同條件下執行 Novita AI 端點
qwen/qwen3-max和您目前的基準。 - 使用測試、結構化評分標準和人工審查對輸出進行評分。
- 根據總輸入 token、輸出 token、延遲和分層成本比較品質。
如果您的評估包含程式碼執行或瀏覽器自動化,請將模型測試與隔離的執行環境配對。Novita AI 代理沙盒 可為代理工作流程提供受控的執行環境,而 Qwen3 Max 模型頁面 是透過 Novita AI 測試此模型的直接入口。
常見問題
Qwen3.7-Max 在 Novita AI 上可用嗎?
是的。Novita AI 將 Qwen3 Max 列為可透過無伺服器 API 使用,模型 ID 為 qwen/qwen3-max。
開發者應使用哪個模型 ID?
使用 qwen/qwen3-max,搭配 Novita AI 相容 OpenAI 的 API 基礎 URL https://api.novita.ai/openai。
Novita AI 為此端點列出了多少上下文長度?
Novita AI 模型頁面為 qwen/qwen3-max 端點列出了 262144 個 token 的上下文長度和 65536 個 token 的最大輸出。
Novita AI 端點是否支援函數呼叫和結構化輸出?
是的。Novita AI 將函數呼叫和結構化輸出列為 qwen/qwen3-max 支援的功能。
結論
Qwen3.7-Max 現在不僅是外部提供者的更新,更是經過驗證的 Novita AI 模型發布故事。使用 Novita AI 無伺服器 API 模型 ID qwen/qwen3-max,根據列出的 262144 個 token 上下文長度和 65536 個 token 最大輸出進行規劃,並在擴展生產使用之前,在真實的代理式編碼和長上下文工作流程上評估此模型。
