在 Novita AI 上運行 Qwen3-Coder-Next:大規模低成本自主編碼代理

在 Novita AI 上運行 Qwen3-Coder-Next:大規模低成本自主編碼代理

Qwen3-Coder-Next 專為自主編碼(agentic coding)設計:適用於多步驟軟體任務,模型需要在此類任務中完成規劃、呼叫工具、從錯誤中恢復,並在長工作流程中維持上下文連貫性。

Novita AI 上,你可以透過相容 OpenAI 的 API 運行 Qwen3-Coder-Next,無需搭建或管理自己的 GPU 基礎設施,即可獲得強大的編碼代理效能。

Try Qwen3-Coder-Next

什麼是 Qwen3-Coder-Next?

模型概覽

項目 詳細資訊
開發團隊 Qwen 團隊(阿里巴巴)
發布日期 2026 年 2 月 4 日
參數量 總共 80B / 啟動時約 3B(MoE 架構)
架構 混合注意力 + 高稀疏度 MoE(混合佈局,包含門控 DeltaNet + 門控注意力)
上下文視窗 原生 262,144 個標記(256K),可擴展

Qwen3-Coder-Next 是一款開源權重、專為自主編碼設計的模型,在真實世界基準測試中表現優異的同時,還能保持推論成本低廉。其 MoE 設計會限制運行時啟動的參數量,混合注意力機制則支援長上下文推理。該模型可直接接入實用編碼工作流程——包括 CLI 工具、IDE 代理、結構化工具呼叫——同時速度足以滿足日常開發需求。

基準測試與效能

基準測試

Qwen3-Coder-Next 的基準測試效能

實際要點

  • SWE-Bench Verified 表現優異:70.6% 的分數表明該模型能處理真實儲存庫層級的錯誤修復,包括搜尋、補丁和測試循環,這是生產級編碼代理的重要指標。
  • 多語言儲存庫支援表現突出:SWE-Bench Multilingual 上 62.8% 的分數表明該模型並非嚴格以英語為優先,適合處理多語言問題、註解和文件的全域團隊。
  • SWE-Bench Pro 成績穩健:在更難的 Pro 子集上取得 44.3% 的分數,展現了更強的長期推理能力,尤其在多步驟除錯和恢復場景中表現突出。
  • TerminalBench 對工具使用的相關性:TerminalBench 2.0 評估結構化的命令/輸出循環,與 DevOps 自動化、CI 除錯和 shell 驅動的代理場景高度契合。
  • Aider 分數支援互動式編程:66.2% 的 Aider 分數是配對編程工作流程的良好指標,適用於迭代編輯、重構和增量功能開發等場景。

速度與延遲

開發者體驗很大程度上取決於延遲,而不僅僅是原始準確率:

Qwen3-coder-next 的速度與延遲表現

這在 Novita AI 上的意義

Qwen3-Coder-Next 的設計高度注重效能——總參數量達 80B,但推論時僅啟動約 3B,這使其在自主編碼工作負載上性價比尤為突出。在 Novita AI 上,這種效能優勢直接轉化為可預期、具競爭力的定價:

  • 輸入: 每百萬個標記 0.2 美元
  • 輸出: 每百萬個標記 1.5 美元

結合 Novita AI 可擴展的 API,你可以部署能處理長上下文推理和多步驟工作流程的高效能編碼代理,無需管理 GPU,也無需承擔不可預測的基礎設施成本

更多關於 Qwen3-Coder-Next 的資訊

如何在 Novita AI 上使用 Qwen 3

快速開始:Playground(測試平台)

要快速評估模型效能,建議先使用 Novita 的 Playground 測試提示詞、比較不同模型、在整合前驗證輸出品質。

前往 Playground 測試

無需編寫代碼和配置,即可在 Playground 上試用 Qwen3-Coder-Next

透過 API 使用 Qwen3-Coder-Next

如何獲取 API 金鑰

  • 步驟 1:創建帳號或登入:造訪 [https://novita.ai](https://novita.ai) 註冊或登入帳號。
  • 步驟 2:前往金鑰管理頁面:登入後找到「API 金鑰」選項。
  • 步驟 3:創建新金鑰:點擊「新增金鑰」按鈕。
  • 步驟 4:立即保存金鑰:金鑰生成後請立刻複製存儲,該金鑰僅會顯示一次。

獲取 API 金鑰

創建專屬 API 金鑰的指南

使用以下代碼範例整合我們的 API:

Python(範例)

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/v3/openai",
)

resp = client.chat.completions.create(
    model="Qwen/Qwen3-Coder-Next",
    messages=[
        {"role": "system", "content": "You are a senior software engineer."},
        {"role": "user", "content": "Fix the bug and write tests. Here is the stack trace: ..."}
    ],
    temperature=0.2,
)

print(resp.choices[0].message.content)

SDK

如果你正在構建代理,Novita 能與所有預期接收 OpenAI Chat Completions 的框架無縫整合:

  • 相容 OpenAI Agents SDK
  • 由於 API 相容,標準 OpenAI Python/Node SDK 僅需少量修改即可使用

第三方平台

Novita 托管的模型也可用於眾多熱門生態系統——你可以將 Qwen3-Coder-Next 接入現有工具,無需改變自己的工作流程:

  • 代理框架與應用構建工具:支援 ContinueAnythingLLMLangChainLangflow 的整合指南。
  • Hugging Face Hub:Novita 被列為 推論提供者(Inference Provider),可透過 Hugging Face 的提供者生態系統運行支援的模型。
  • 相容 OpenAI 的工具:Novita 遵循 OpenAI API 標準,因此你可以用極少的修改將 OpenAI 風格的應用和工具(如 ClineCursorTraeQwen Code)接入使用。
  • 相容 Anthropic 的存取方式:Novita 也支援 Anthropic SDK 相容整合,適用於 Claude Code 風格的工作流程。
  • OpenCode 與可觀測性:可直接在 OpenCode 中使用 Novita。

總結

Qwen3-Coder-Next 恰好達到了實用的最佳平衡點:自主編碼能力強、長上下文推理能力出色、吞吐量高,得益於能控制運行成本的 MoE 設計。對於希望推出編碼代理、或單純想加速開發工作流程的團隊而言,透過 Novita AI 的 OpenAI 相容 API 運行 Qwen3-Coder-Next,是從評估到落地生產最簡單的路徑之一。

Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 來部署 AI 模型,同時也提供平價且可靠的 GPU 雲端服務,用於構建和擴展 AI 應用。

常見問題

什麼是 Qwen3-Coder-Next?

Qwen3-Coder-Next 是 Qwen 團隊推出的開源權重編碼模型,專為自主編碼設計(適用於包含工具使用、執行反饋和錯誤恢復的多步驟編碼任務)。它基於 Qwen3-Next-80B-A3B-Base,採用混合注意力 + MoE 架構,能以更低的推論成本實現強勁的編碼/代理效能。

Qwen3 Coder 的費用是多少?

Novita AI 上,Qwen3-Coder-Next 的定價為每 100 萬個輸入標記 0.20 美元、每 100 萬個輸出標記 1.50 美元(無伺服器模式)

哪些 API 提供者提供 Qwen3-Coder-Next?

Qwen3-Coder-Next 可透過多家 API 提供者取得,其中 Novita AI 是性價比高且相容 OpenAI 的選擇。其他提供者還包括 Chutes、Parasail 和 Together AI,它們在延遲、吞吐量和定價上各有差異。