開發者完整指南：如何存取 Qwen3.5-397B-A17B

Qwen3.5-397B-A17B 是什麼？
基準測試表現
如何存取 Qwen3.5-397B-A17B
總結

大規模混合專家（MoE）模型正在重新定義企業 AI 的可行邊界。其中，Qwen3.5-397B-A17B 是當今最強大的開源大型語言模型之一，以空前的規模提供最先進的推理、編程與多語言能力。

在本指南中，我們將說明：

Qwen3.5-397B-A17B 是什麼
各項基準測試的表現如何
四種實用的存取與部署方式

Qwen3.5-397B-A17B 是什麼？

Qwen3.5-397B-A17B 是阿里巴巴雲 Qwen 團隊推出的旗艦開源權重模型，採用最先進的混合架構，結合線性注意力與稀疏混合專家（MoE）設計，提供前沿級別的推理、編程與多模態能力。儘管擁有高達 3970 億個總參數，該模型每次前向傳播僅激活 170 億個參數，在保持高性能的同時大幅降低了運算成本。此外，它將多語言支援從 119 種擴展至 201 種語言與方言，進一步提升了全球可用性。


屬性	詳細資訊
開發團隊	阿里巴巴雲 Qwen 團隊
發布日期	2026 年 2 月
參數	總參數 397B，每 token 激活 17B
架構	混合架構：線性注意力（門控 Delta 網絡）+ 稀疏 MoE
上下文視窗	原生支援 256K，可擴展至約 100 萬 tokens
輸入能力	文字、圖片、影片
輸出能力	文字
語言支援	201 種語言與方言

基準測試表現

Qwen3.5-397B-A17B 專為前沿級別的推理、編程與多模態理解而設計，公開技術報告顯示其在各大學術、數學與程式碼生成基準測試中均表現優異，儘管評估結果會隨時間持續更新。

資料來源：Qwen

智能體智慧與工具使用

Qwen3.5 專為「智能體工作流」設計——即 AI 作為自主助理執行的任務。

搜尋優勢：在 BrowseComp（78.6） 中大幅領先，顯著優於 Gemini 3 Pro（59.2），這代表其具備更強的網路研究能力。
可靠的工具互動：在工具呼叫的 BFCL V4（72.9） 中排名第一，在指令遵循的 IFBench（76.5） 中表現出高可靠性。
強勁的編程能力：儘管 Claude Opus 4.5 在 SWE-bench（80.9） 和 Terminal-Bench 2（59.3） 中略佔優勢，Qwen3.5 仍以 76.4 和 52.5 的成績躋身第一梯隊，證明其能勝任複雜的工程任務。

多模態與視覺能力

作為原生多模態模型，Qwen3.5 在視覺邏輯領域挑戰現有領先者。

文件處理專家：在 OmniDocBench v1.5（90.8） 中位居行業第一，在複雜文件識別與理解方面優於 GPT-5.2（85.7）和 Gemini 3 Pro（88.5）。
視覺邏輯：在 MMMU-Pro 中獲得 79.0 分，與 GPT-5.2（79.5）幾乎持平，在高階視覺推理方面與 Gemini 3 Pro（81.0）競爭力十足。
影片推理：在 Video-MME 中取得 87.5 的優異成績，與 Gemini 3 Pro（88.4）不分上下。

核心語言與通用智慧

高階知識：MMMLU 得分 88.5，展現出比 Qwen3-Max-Thinking（84.4）更廣泛的多語言知識。
科學推理：在 GPQA Diamond 中取得世界級水準的 88.4 分，證明其能處理研究生級別的科學問題，儘管仍略遜於 GPT-5.2（92.4）的專業推理能力。
具身推理：ERQA 得分（67.5） 較之前的 Qwen 版本有顯著提升，標誌著其在情境推理方面的能力不斷增強。

如何存取 Qwen3.5-397B-A17B

由於 Qwen3.5-397B-A17B 體積龐大，存取它需要強大的運算基礎設施。以下介紹四種實用的使用方式。

選項 1：Playground（無需部署）

若想快速測試 Qwen3.5-397B-A17B 且無需搭建基礎設施，最簡單的方式是使用託管的 Playground 介面。

透過 Novita AI Playground，你可以：

直接在瀏覽器中與 Qwen3.5-397B-A17B 互動
調整 temperature、top-p、max tokens 參數
測試推理、編程或多語言任務的提示詞
比較不同模型的輸出結果

前往 Playground

Novita Playground

選項 2：API 存取（生產級可用）

對於實際應用場景，API 存取是最常見的方式。

為什麼選擇 Novita AI API？

企業級 GPU 集群
優化的 MoE 推理
低延遲分散式服務
高併發下的自動擴展
相容 OpenAI 的端點
按用量付費定價

API 定價


Token 類型	價格
輸入	每 100 萬 tokens 0.6 美元
輸出	每 100 萬 tokens 3.6 美元

API 快速入門

步驟 1：建立帳號或登入：造訪 https://novita.ai 註冊或登入。
步驟 2：前往金鑰管理頁面：登入後找到 「API 金鑰」 選項。
步驟 3：建立新金鑰：點擊 「新增金鑰」 按鈕。
步驟 4：立即儲存金鑰：金鑰生成後請立即複製並妥善保管，系統僅會顯示一次。

取得 API 金鑰

範例（Python）

from openai import OpenAI
client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
    model="qwen/qwen3.5-397b-a17b",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=64000,
    temperature=0.7
)
print(response.choices[0].message.content)

選項 3：SDK 整合

Novita 完全相容 OpenAI 風格的 SDK：

即插即用替代方案（只需修改 base_url 與模型名稱）
支援路由與智能體編排
可輕鬆整合至 LangChain、自定義智能體與後端系統

選項 4：第三方平台

Novita 已整合以下平台：

Continue
AnythingLLM
LangChain
Langflow
Claude Code
Hugging Face (Inference Provider)
OpenAI 相容工具（Cursor、Cline、Qwen Code 等）
Anthropic SDK 相容工作流
OpenCode
OpenClaw (Clawdbolt)

總結

Qwen3.5-397B-A17B 代表了新一代超大規模 MoE 語言模型，兼具規模、效率與強大多語言推理能力。

然而，存取與部署的複雜性可能會拖慢團隊節奏。透過 Novita AI，你可以：

透過 Playground 立即測試
透過生產級 API 整合
使用 SDK 打造可擴展的應用程式
免去繁重的 GPU 基礎設施管理負擔

若你已準備好基於 Qwen3.5-397B-A17B 進行開發，今天就從 Novita AI 模型 API 開始，更快、更高效地將前沿 AI 能力融入你的產品。

Novita AI 是一個 AI 雲端平台，為開發者提供簡單的 API 來部署 AI 模型，同時也提供平價且可靠的 GPU 雲端服務，用於建構與擴展 AI 應用。

常見問題

Qwen3.5-397B-A17B 是什麼？

Qwen3.5-397B-A17B 是由阿里巴巴雲 Qwen 團隊開發的 397B 參數混合專家（MoE）大型語言模型，每 token 激活 17B 參數，支援文字、圖片、影片輸入，提供強勁的推理、編程與多語言表現。

Qwen3.5-397B-A17B 是否比其他開源權重 LLM 更優秀？

它目前是市面上最強大的開源權重模型之一，在推理、編程（SWE-bench）、多模態任務（MMMU-Pro、OmniDocBench）與智能體工作流方面的基準測試成績都具有競爭力。效能比較會根據工作负载與評估設定而有所不同。

執行 Qwen3.5-397B-A17B 需要多少 GPU 資源？

獨立執行通常需要配備分散式平行運算的多節點高記憶體 GPU 集群（如 A100 或 H100 等級的 GPU）。大多數團隊會透過 Novita AI 這類受管理的雲端 API 存取，以避免複雜的基礎設施搭建。

開發者完整指南：如何存取 Qwen3.5-397B-A17B

Qwen3.5-397B-A17B 是什麼？