開發者完整指南:如何存取 Qwen3.5-397B-A17B

開發者完整指南:如何存取 Qwen3.5-397B-A17B

大規模混合專家(MoE)模型正在重新定義企業 AI 的可行邊界。其中,Qwen3.5-397B-A17B 是當今最強大的開源大型語言模型之一,以空前的規模提供最先進的推理、編程與多語言能力。

在本指南中,我們將說明:

  • Qwen3.5-397B-A17B 是什麼
  • 各項基準測試的表現如何
  • 四種實用的存取與部署方式

立即試用 Qwen3.5-397B-A17B!

Qwen3.5-397B-A17B 是什麼?

Qwen3.5-397B-A17B 是阿里巴巴雲 Qwen 團隊推出的旗艦開源權重模型,採用最先進的混合架構,結合線性注意力與稀疏混合專家(MoE)設計,提供前沿級別的推理、編程與多模態能力。儘管擁有高達 3970 億個總參數,該模型每次前向傳播僅激活 170 億個參數,在保持高性能的同時大幅降低了運算成本。此外,它將多語言支援從 119 種擴展至 201 種語言與方言,進一步提升了全球可用性。

屬性 詳細資訊
開發團隊 阿里巴巴雲 Qwen 團隊
發布日期 2026 年 2 月
參數 總參數 397B,每 token 激活 17B
架構 混合架構:線性注意力(門控 Delta 網絡)+ 稀疏 MoE
上下文視窗 原生支援 256K,可擴展至約 100 萬 tokens
輸入能力 文字、圖片、影片
輸出能力 文字
語言支援 201 種語言與方言

基準測試表現

Qwen3.5-397B-A17B 專為前沿級別的推理、編程與多模態理解而設計,公開技術報告顯示其在各大學術、數學與程式碼生成基準測試中均表現優異,儘管評估結果會隨時間持續更新。

Qwen3.5-397B-A17B 基準測試結果

資料來源:Qwen

智能體智慧與工具使用

Qwen3.5 專為「智能體工作流」設計——即 AI 作為自主助理執行的任務。

  • 搜尋優勢:在 BrowseComp(78.6) 中大幅領先,顯著優於 Gemini 3 Pro(59.2),這代表其具備更強的網路研究能力。
  • 可靠的工具互動:在工具呼叫的 BFCL V4(72.9) 中排名第一,在指令遵循的 IFBench(76.5) 中表現出高可靠性。
  • 強勁的編程能力:儘管 Claude Opus 4.5 在 SWE-bench(80.9)Terminal-Bench 2(59.3) 中略佔優勢,Qwen3.5 仍以 76.4 和 52.5 的成績躋身第一梯隊,證明其能勝任複雜的工程任務。

多模態與視覺能力

作為原生多模態模型,Qwen3.5 在視覺邏輯領域挑戰現有領先者。

  • 文件處理專家:在 OmniDocBench v1.5(90.8) 中位居行業第一,在複雜文件識別與理解方面優於 GPT-5.2(85.7)和 Gemini 3 Pro(88.5)。
  • 視覺邏輯:在 MMMU-Pro 中獲得 79.0 分,與 GPT-5.2(79.5)幾乎持平,在高階視覺推理方面與 Gemini 3 Pro(81.0)競爭力十足。
  • 影片推理:在 Video-MME 中取得 87.5 的優異成績,與 Gemini 3 Pro(88.4)不分上下。

核心語言與通用智慧

  • 高階知識MMMLU 得分 88.5,展現出比 Qwen3-Max-Thinking(84.4)更廣泛的多語言知識。
  • 科學推理:在 GPQA Diamond 中取得世界級水準的 88.4 分,證明其能處理研究生級別的科學問題,儘管仍略遜於 GPT-5.2(92.4)的專業推理能力。
  • 具身推理ERQA 得分(67.5) 較之前的 Qwen 版本有顯著提升,標誌著其在情境推理方面的能力不斷增強。

如何存取 Qwen3.5-397B-A17B

由於 Qwen3.5-397B-A17B 體積龐大,存取它需要強大的運算基礎設施。以下介紹四種實用的使用方式。

選項 1:Playground(無需部署)

若想快速測試 Qwen3.5-397B-A17B 且無需搭建基礎設施,最簡單的方式是使用託管的 Playground 介面

透過 Novita AI Playground,你可以:

  • 直接在瀏覽器中與 Qwen3.5-397B-A17B 互動
  • 調整 temperature、top-p、max tokens 參數
  • 測試推理、編程或多語言任務的提示詞
  • 比較不同模型的輸出結果

前往 Playground

在 Novita Playground 使用 Qwen3.5-397B-A17B:無需設定、無需編寫程式碼

Novita Playground

選項 2:API 存取(生產級可用)

對於實際應用場景,API 存取是最常見的方式。

為什麼選擇 Novita AI API?

  • 企業級 GPU 集群
  • 優化的 MoE 推理
  • 低延遲分散式服務
  • 高併發下的自動擴展
  • 相容 OpenAI 的端點
  • 按用量付費定價

API 定價

Token 類型 價格
輸入 每 100 萬 tokens 0.6 美元
輸出 每 100 萬 tokens 3.6 美元

API 快速入門

  • 步驟 1:建立帳號或登入:造訪 https://novita.ai 註冊或登入。
  • 步驟 2:前往金鑰管理頁面:登入後找到 「API 金鑰」 選項。
  • 步驟 3:建立新金鑰:點擊 「新增金鑰」 按鈕。
  • 步驟 4:立即儲存金鑰:金鑰生成後請立即複製並妥善保管,系統僅會顯示一次。

取得 API 金鑰

如何取得你的 API 金鑰

範例(Python)

from openai import OpenAI
client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
    model="qwen/qwen3.5-397b-a17b",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=64000,
    temperature=0.7
)
print(response.choices[0].message.content)

選項 3:SDK 整合

Novita 完全相容 OpenAI 風格的 SDK:

  • 即插即用替代方案(只需修改 base_url 與模型名稱)
  • 支援路由與智能體編排
  • 可輕鬆整合至 LangChain、自定義智能體與後端系統

選項 4:第三方平台

Novita 已整合以下平台:

總結

Qwen3.5-397B-A17B 代表了新一代超大規模 MoE 語言模型,兼具規模、效率與強大多語言推理能力。

然而,存取與部署的複雜性可能會拖慢團隊節奏。透過 Novita AI,你可以:

  • 透過 Playground 立即測試
  • 透過生產級 API 整合
  • 使用 SDK 打造可擴展的應用程式
  • 免去繁重的 GPU 基礎設施管理負擔

若你已準備好基於 Qwen3.5-397B-A17B 進行開發,今天就從 Novita AI 模型 API 開始,更快、更高效地將前沿 AI 能力融入你的產品。

Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 來部署 AI 模型,同時也提供平價且可靠的 GPU 雲端服務,用於建構與擴展 AI 應用。

常見問題

Qwen3.5-397B-A17B 是什麼?

Qwen3.5-397B-A17B 是由阿里巴巴雲 Qwen 團隊開發的 397B 參數混合專家(MoE)大型語言模型,每 token 激活 17B 參數,支援文字、圖片、影片輸入,提供強勁的推理、編程與多語言表現。

Qwen3.5-397B-A17B 是否比其他開源權重 LLM 更優秀?

它目前是市面上最強大的開源權重模型之一,在推理、編程(SWE-bench)、多模態任務(MMMU-Pro、OmniDocBench)與智能體工作流方面的基準測試成績都具有競爭力。效能比較會根據工作负载與評估設定而有所不同。

執行 Qwen3.5-397B-A17B 需要多少 GPU 資源?

獨立執行通常需要配備分散式平行運算的多節點高記憶體 GPU 集群(如 A100 或 H100 等級的 GPU)。大多數團隊會透過 Novita AI 這類受管理的雲端 API 存取,以避免複雜的基礎設施搭建。