在 Claude Code 中使用 Qwen3-235B-A22B-Thinking：節省 80% 成本

Qwen3-235B-A22B-Thinking-2507 真的具備真正的推理能力嗎？
為什麼 Qwen3-235B-A22B-Thinking-2507 與 Claude Code 搭配最佳
如何在 Claude Code 中使用 Qwen3-235B-A22B-Thinking-2507
結論

開發者在打造代理型（agentic）編碼助手時，面臨一個關鍵抉擇：為 Claude Sonnet 4.5 這類封閉模型支付每百萬輸出 token 3-15 美元，或轉向以極低成本提供類似能力的開放推理模型。 阿里巴巴的 Qwen3-235B-A22B-Thinking-2507 突破了這個取捨，透過專屬的「思考模式」提供推理效能——透過 Novita AI 每百萬輸入/輸出 token 僅需 $0.30/$3.00。

本指南將逐步說明如何將 Qwen3-235B-A22B-Thinking-2507 整合至 Claude Code，這個 Anthropic 相容的終端機代理程式能實現代理型編碼工作流程。您將看到這個 235B MoE 模型（每個 token 啟用 22B 參數）如何利用 Claude Code 豐富的工具環境，以延伸的推理軌跡自動化複雜的編碼任務。

立即試用 Qwen3-235B-A22B-Thinking-2507！

Qwen3-235B-A22B-Thinking-2507 真的具備真正的推理能力嗎？

Qwen3-235B-A22B-Thinking-2507 是 Qwen3 系列中最新支援思考能力的模型，在推理能力上有重大進展。它在邏輯問題解決、數學、科學分析、編碼與學術評量上表現優異——達到或超越人類專家水準，並與開源推理模型競爭時展現出色效能。除了推理優勢，它還提升了通用能力，包括更準確的指令遵循、進階工具整合、高度自然的文字生成，以及與人類意圖更佳的一致性。該模型還支援延伸的 131K token 上下文，能夠連貫且深入地處理長文件與複雜討論。

架構與能力

技術參數	規格	說明
模型類型	因果語言模型	基於 Transformer 架構
總參數	235B	22B 啟用參數
非嵌入參數	234B	實際運算參數
層數	94 層	深度神經網路結構
注意力頭數	Q: 64, KV: 4	使用 GQA 機制
專家數量	128	MoE 架構設計
啟用專家數	8	動態專家選擇
上下文長度	262,144 tokens	原生長上下文支援

基準效能（推理任務）

來自 Hugging Face

Qwen3-235B-A22B-Thinking-2507 在推理密集型與知識密集型任務中表現出色，特別是在數學、多語言知識及文件/影片理解方面。其在複雜認知與理解基準測試中持續展現與更大模型競爭的效能。

成本與 Token 效率

以每百萬輸入 token $0.30 與每百萬輸出 token $3.00 的價格，與 Claude Sonnet 4.5（每百萬 token $3/$15）相比，Qwen3-235B-A22B-Thinking-2507 在輸入端節省 90% 成本，輸出端節省 80% 成本。對於延伸推理任務，該模型最多可輸出 81K tokens——這意味著一次複雜任務的輸出 token 成本可能僅需 $0.24，而 Claude 則需 $1.22。

立即試用 Qwen3-235B-A22B-Thinking-2507！

為什麼 Qwen3-235B-A22B-Thinking-2507 與 Claude Code 搭配最佳

Claude Code 是 Anthropic 發佈的終端機代理型編碼介面。它透過呼叫工具（檔案編輯、bash 指令、搜尋）、跨任務管理上下文，並根據反饋疊代來協調多步驟工作流程。Qwen3-235B-A22B-Thinking-2507 明確的推理軌跡與此代理型範式完美契合——模型在執行工具呼叫前會顯示其規劃步驟，讓複雜工作流程可除錯且透明。

1. 專為代理型互動最佳化

Qwen3-235B-A22B-Thinking-2507 專為 採取行動、使用工具及管理多步驟任務 而設計。其思考模式輸出結構化的推理鏈，與 Claude Code 對規劃 → 執行 → 驗證工作流程的期望相符。當模型規劃跨 5 個檔案的程式重構時，您可以在任何檔案編輯發生前看到逐步推理過程。

2. 豐富的工具鏈與 API 支援

Claude Code 提供預先配置的 檔案系統操作、bash 執行、grep/搜尋、git 指令與外部工具整合 功能。Qwen3 模型支援工具呼叫模式、JSON 模式與函式定義——可無縫呼叫 Claude Code 的工具套件，用於自動化測試、部署腳本與多檔案重構等任務。

3. 即時反饋迴圈

模型的思考模式實現了 適應性除錯：如果工具呼叫失敗（例如測試套件錯誤），推理軌跡會顯示模型當初的假設，讓您能在對話中修正誤解。這對於早期錯誤會串聯影響 20 多個步驟的代理型工作流程至關重要。

4. 延伸輸出以處理複雜推理

Claude Code 的任務如「重構 8 個檔案中的驗證流程」或「使用分析器整合除錯記憶體洩漏」需要 10K+ token 的多步驟計劃。Qwen3-235B-A22B-Thinking-2507 支援最多 81K token 的複雜推理——遠超過一般模型限制——同時將成本控制在可管理範圍（每 81K 輸出 $0.24，Claude 為 $1.22）。

如何在 Claude Code 中使用 Qwen3-235B-A22B-Thinking-2507

Novita AI 提供一個 Anthropic 相容的 API 端點，意味著只需設定環境變數，Claude Code 便可與 Qwen3-235B-A22B-Thinking-2507 搭配使用——無需修改任何程式碼。該模型 256K 的上下文視窗及 $0.30/$3.00 每百萬輸入/輸出 token 的定價，使其成為延伸編碼工作階段的理想選擇。

前置準備 — 取得 Novita AI API 金鑰

步驟 1： 在 Novita AI 建立免費帳戶並登入。

步驟 2： 導航至 ** 模型庫** 並搜尋 qwen/qwen3-235b-a22b-thinking-2507。

步驟 3： 點選 ** 開始免費試用** 以啟用存取權限（Novita 為新用戶提供試用額度）。

步驟 4： 前往 設定 → API Keys 並點選 Generate API Key。複製金鑰。

步驟 5： 使用下列 Python 測試驗證 API 連線：

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="qwen/qwen3-235b-a22b-thinking-2507",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=32768,
    temperature=0.7
)

print(response.choices[0].message.content)

您應該會看到模型的回應，其中包含以 `` 標籤包圍的推理軌跡。

立即試用 Qwen3-235B-A22B-Thinking-2507！

Claude Code 設定指南

步驟 1：安裝 Claude Code

#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash

#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex

#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd

Windows 需要 Git for Windows。 如果尚未安裝，請先安裝。

步驟 2：設定環境變數

Claude Code 使用 4 個環境變數將 API 請求導向 Novita AI：

#For macOS/Linux (Bash/Zsh):
# Set the Anthropic SDK compatible API endpoint provided by Novita.
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# Set the model provided by Novita.
export ANTHROPIC_MODEL="qwen/qwen3-235b-a22b-thinking-2507"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3-235b-a22b-thinking-2507"

#For Windows (PowerShell):
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Novita API Key"
$env:ANTHROPIC_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"
$env:ANTHROPIC_SMALL_FAST_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"

說明：

ANTHROPIC_BASE_URL：將 Claude Code 指向 Novita 的 Anthropic 相容端點
ANTHROPIC_AUTH_TOKEN：您的 Novita API 金鑰（非 Anthropic 金鑰）
ANTHROPIC_MODEL：主要模型，用於複雜任務（思考模式）
ANTHROPIC_SMALL_FAST_MODEL：快速操作的備用模型（若想保持一致的推理行為，設為相同模型）

步驟 3：啟動 Claude Code

導航至您的專案目錄並啟動 Claude Code：

cd <your-project-directory>
claude .

您會在互動式工作階段中看到 Claude Code 提示。模型的思考模式會在處理複雜查詢時自動啟用。

範例任務：

> Refactor the authentication module to use JWT tokens instead of sessions. Update all 5 related files and add unit tests.

Claude Code 會分析請求，呼叫 Qwen3-235B-A22B-Thinking-2507 生成多步驟計劃（可在 ` 區塊中看到），然後執行檔案編輯、撰寫測試並驗證變更。

專家提示： 對於數學密集或演算法設計任務，請在 API 呼叫中將 max_tokens 增加至 131072，以充分利用 Qwen3-235B-A22B-Thinking-2507 的延伸推理能力。如果 Claude Code 的設定暴露了 token 限制，也可以在此設定。

立即試用 Qwen3-235B-A22B-Thinking-2507！

Qwen3-235B-A22B-Thinking-2507 以封閉模型的一小部分成本，提供進階推理、長上下文處理及結構化多步驟規劃。結合 Claude Code，它能實現透明、可除錯的代理型編碼工作流程，使其成為開發者在尋求高效能推理與編碼自動化，同時避免高昂 token 費用的實用解決方案。

結論

Qwen3-235B-A22B-Thinking-2507 為 Claude Code 的代理型工作流程帶來延伸推理、透明的思維鏈輸出，以及強大的工具使用能力——且成本僅為封閉模型的一小部分。對於執行複雜編碼任務的開發者而言，這項組合同時提供了效能與成本效益。

重點提要： 設定四個環境變數，將 Claude Code 指向 Novita AI 的 Anthropic 相容端點，幾分鐘內即可運行進階推理工作流程。立即在 Novita AI 上試用 Qwen3-235B-A22B-Thinking-2507，今天就開始建構。

Qwen3-235B-A22B-Thinking-2507 與一般編碼模型有何不同？

它是一個純思考模型，在生成程式碼之前會以 ` 區塊輸出結構化的推理軌跡，讓複雜的代理型工作流程變得透明且可除錯。與一般指令模型不同，它專門針對競賽程式設計、演算法設計與多步驟除錯等推理密集型任務進行最佳化。

我可以在 Claude Code 以外的工具中使用 Qwen3-235B-A22B-Thinking-2507 嗎？

可以——它支援任何與 OpenAI 相容 API 的工具。Trae（GUI IDE）、OpenCode（終端機代理）、Cursor（程式碼編輯器）以及自訂的 Python/Node.js 腳本均可透過 Novita AI 的 https://api.novita.ai/v3/openai 端點使用。

我需要 GPU 才能在本地端執行 Qwen3-235B-A22B-Thinking-2507 嗎？

是的——估計需要 4×H100 80GB 使用 FP8。對大多數開發者而言，除非每月執行超過 10,000 個任務，否則 Novita AI 的 API 比自建託管更具成本效益。

推薦閱讀

Novita AI 是一個 AI 與代理雲端平台，協助開發者與新創公司建構、部署和擴展模型及代理型應用程式，提供高效能、可靠性和成本效益。

在 Claude Code 中使用 Qwen3-235B-A22B-Thinking：節省 80% 成本

Qwen3-235B-A22B-Thinking-2507 真的具備真正的推理能力嗎？

架構與能力

基準效能（推理任務）

成本與 Token 效率

為什麼 Qwen3-235B-A22B-Thinking-2507 與 Claude Code 搭配最佳

1. 專為代理型互動最佳化

2. 豐富的工具鏈與 API 支援

3. 即時反饋迴圈

4. 延伸輸出以處理複雜推理

如何在 Claude Code 中使用 Qwen3-235B-A22B-Thinking-2507

前置準備 — 取得 Novita AI API 金鑰

Claude Code 設定指南

步驟 1：安裝 Claude Code

步驟 2：設定環境變數

步驟 3：啟動 Claude Code

結論

Product

RESOURCES

Partners

Company

Qwen3-235B-A22B-Thinking-2507 真的具備真正的推理能力嗎？

架構與能力

基準效能（推理任務）

成本與 Token 效率

為什麼 Qwen3-235B-A22B-Thinking-2507 與 Claude Code 搭配最佳

1. 專為代理型互動最佳化

2. 豐富的工具鏈與 API 支援

3. 即時反饋迴圈

4. 延伸輸出以處理複雜推理

如何在 Claude Code 中使用 Qwen3-235B-A22B-Thinking-2507

前置準備 — 取得 Novita AI API 金鑰

Claude Code 設定指南

步驟 1：安裝 Claude Code

步驟 2：設定環境變數

步驟 3：啟動 Claude Code

結論

相關文章

Product

RESOURCES

Partners

Company