開發自主編碼助手時,開發者正面臨一個關鍵抉擇:要麼為Claude Sonnet 4.5這類封閉模型支付每百萬輸出代幣3至15美元的費用,要麼轉向承諾以極低成本提供相近能力的開放式推理模型。 阿里巴巴推出的Qwen3-235B-A22B-Thinking-2507打破了這一取捨,它配備專屬的「思考模式」,可提供推理性能,透過Novita AI的售價僅為每百萬輸入/輸出代幣0.30/3.00美元。
本指南將一步步講解如何將Qwen3-235B-A22B-Thinking-2507整合至Claude Code——這是一款符合Anthropic規範的終端代理,可實現自主編碼工作流程。你將看到這個235B參數的MoE模型(每代幣僅激活22B參數)如何利用Claude Code豐富的工具環境,透過擴展推理追蹤自動化複雜編碼任務。
立即試用Qwen3-235B-A22B-Thinking-2507!
Qwen3-235B-A22B-Thinking-2507是否真的具備強推理能力?
Qwen3-235B-A22B-Thinking-2507是Qwen3系列中最新的支援思考的模型,推理能力有重大突破。它在邏輯問題解決、數學、科學分析、編碼和學術評估等領域表現優異,性能達到甚至超越人類專家水平,在開源推理模型中表現位居前列。除了推理優勢外,它還提升了通用能力,包括更精確的指令遵循、先進的工具整合、高度自然的文本生成,以及更符合人類意圖的對齊效果。該模型還支援長達131K代幣的擴展上下文,可連貫且深入地處理長篇文件和複雜討論。
架構與能力
| 技術參數 | 規格 | 說明 |
|---|---|---|
| 模型類型 | 因果語言模型 | 基於Transformer架構 |
| 總參數 | 235B | 每代幣激活22B參數 |
| 非嵌入參數 | 234B | 實際計算參數 |
| 層數 | 94層 | 深度神經網絡結構 |
| 注意力頭 | Q:64,KV:4 | 使用GQA機制 |
| 專家數量 | 128 | MoE架構設計 |
| 激活專家數 | 8 | 動態專家選擇 |
| 上下文長度 | 262,144代幣 | 原生長上下文支援 |
基準測試性能(推理任務)

來源:Hugging Face
Qwen3-235B-A22B-Thinking-2507在推理密集型與知識密集型任務中表現優異,尤其在數學、多語言知識、文件/影片理解方面尤為突出。在複雜認知與理解類基準測試中,其性能始終能與更大規模的模型競爭。
成本與代幣效率
Qwen3-235B-A22B-Thinking-2507的售價為每百萬輸入代幣0.30美元、每百萬輸出代幣3.00美元,與Claude Sonnet 4.5(每百萬代幣3/15美元)相比,輸入成本節省90%,輸出成本節省80%。對於需要擴展推理的任務,該模型最多可輸出81K代幣——這意味著單個複雜任務的輸出代幣成本僅為0.24美元,而使用Claude則需1.22美元。

立即試用Qwen3-235B-A22B-Thinking-2507!
為何Qwen3-235B-A22B-Thinking-2507與Claude Code是最佳搭配?
Claude Code是Anthropic發布的基於終端的自主編碼介面。它透過調用工具(文件編輯、bash命令、搜尋)、跨任務管理上下文、以及根據反饋迭代,來協調多步驟工作流程。Qwen3-235B-A22B-Thinking-2507的顯式推理追蹤與這種自主範式完美契合——模型在執行工具調用前會先展示其規劃步驟,讓複雜工作流程易於除錯且透明可追溯。
1. 針對自主互動優化
Qwen3-235B-A22B-Thinking-2507的設計目標是執行操作、使用工具、管理多步驟任務。它的思考模式會輸出結構化的推理鏈,符合Claude Code對「規劃→執行→驗證」工作流程的預期。當模型規劃對5個文件進行重構時,你可以在任何文件編輯發生前看到逐步推理過程。
2. 豐富的工具鏈與API支援
Claude Code預先配置了對文件系統操作、bash執行、grep/搜尋、git命令以及外部工具整合的存取。Qwen3系列模型支援工具調用架構、JSON模式和函數定義——可無縫調用Claude Code的工具套件,完成自動化測試、部署腳本、多文件重構等任務。
3. 實時反饋循環
該模型的思考模式實現了自適應除錯:如果工具調用失敗(例如測試套件報錯),推理追蹤會顯示模型的假設內容,讓你可以會話中修正錯誤認知。這對於自主工作流程至關重要,因為早期錯誤可能會在20多個步驟中連鎖擴散。
4. 擴展輸出以應對複雜推理
像是「重構8個文件中的認證流程」或「整合分析器除錯內存洩漏」這類Claude Code任務,需要輸出10K+代幣的多步驟計劃。Qwen3-235B-A22B-Thinking-2507支援最多81K代幣的複雜推理,遠超普通模型限制,同時成本可控(輸出81K代幣僅需0.24美元,而Claude需1.22美元)。
如何在Claude Code中使用Qwen3-235B-A22B-Thinking-2507
Novita AI提供了符合Anthropic規範的API端點,這意味著只需透過簡單的環境變數配置,即可讓Claude Code與Qwen3-235B-A22B-Thinking-2507協同工作,無需修改任何程式碼。該模型配備256K上下文窗口,且每百萬輸入/輸出代幣售價僅為0.30/3.00美元,非常適合長時間編碼場景。
前置條件——取得Novita AI API金鑰
步驟1: 在Novita AI註冊免費帳號並登入。
步驟2: 進入模型庫,搜尋qwen/qwen3-235b-a22b-thinking-2507。
步驟3: 點擊開始免費試用以啟用存取權限(Novita會為新用戶提供試用額度)。
步驟4: 前往**設定 → API金鑰**,點擊生成API金鑰,並複製該金鑰。
步驟5: 使用以下Python測試驗證API連線:
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="qwen/qwen3-235b-a22b-thinking-2507",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=32768,
temperature=0.7
)
print(response.choices[0].message.content)
你將看到模型的回覆中,推理追蹤被封裝在<think>標籤內。
立即試用Qwen3-235B-A22B-Thinking-2507!
Claude Code設定指南
步驟1:安裝Claude Code
#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash
#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex
#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
Windows系統需要安裝Git for Windows。 若尚未安裝,請先完成安裝。
步驟2:設定環境變數
Claude Code使用4個環境變數來將API請求路由至Novita AI:
#For macOS/Linux (Bash/Zsh):
# 設定Novita提供的符合Anthropic SDK的API端點。
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# 設定Novita提供的模型。
export ANTHROPIC_MODEL="qwen/qwen3-235b-a22b-thinking-2507"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3-235b-a22b-thinking-2507"
#For Windows (PowerShell):
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Novita API Key"
$env:ANTHROPIC_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"
$env:ANTHROPIC_SMALL_FAST_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"
說明:
ANTHROPIC_BASE_URL:將Claude Code指向Novita的符合Anthropic規範的端點ANTHROPIC_AUTH_TOKEN:你的Novita API金鑰(非Anthropic金鑰)ANTHROPIC_MODEL:複雜任務的主要模型(思考模式)ANTHROPIC_SMALL_FAST_MODEL:快速操作的備用模型(若希望推理行為一致,可設定為與主模型相同)
步驟3:啟動Claude Code
前往你的專案目錄並啟動Claude Code:
cd <your-project-directory>
claude .
你將在互動式會話中看到Claude Code的提示符。遇到複雜查詢時,模型的思考模式會自動啟動。
示例任務:
> 重構認證模組以使用JWT令牌替代會話,更新所有5個相關文件並新增單元測試。
Claude Code會分析請求,調用Qwen3-235B-A22B-Thinking-2507生成多步驟計劃(可在<think>區塊中查看),隨後執行文件編輯、編寫測試並驗證修改結果。
實用技巧: 對於重數學運算或算法設計任務,請在API呼叫中將
max_tokens提升至131072,以發揮Qwen3-235B-A22B-Thinking-2507的擴展推理能力。如果Claude Code暴露了代幣限制設定,可透過其配置檔案修改此參數。
立即試用Qwen3-235B-A22B-Thinking-2507!
Qwen3-235B-A22B-Thinking-2507以遠低於封閉模型的成本,提供先進推理、長上下文處理和結構化多步驟規劃能力。結合Claude Code使用,可實現透明、易於除錯的自主編碼工作流程,是追求高性能推理與編碼自動化、又不想承擔高昂代幣費用的開發者的實用解決方案。
總結
Qwen3-235B-A22B-Thinking-2507為Claude Code的自主工作流程帶來了擴展推理、透明的思路輸出和強大的工具使用能力,且成本遠低於封閉模型。對於執行複雜編碼任務的開發者而言,這一組合兼具性能與預算效率。
核心要點: 只需設定四個環境變數,將Claude Code指向Novita AI的符合Anthropic規範的端點,幾分鐘內即可運行先進推理工作流程。立即在Novita AI上試用Qwen3-235B-A22B-Thinking-2507,今天就開始構建吧。
Qwen3-235B-A22B-Thinking-2507與普通編碼模型有何不同?
它是一款純思考模型,會在生成程式碼前於<think>區塊中輸出結構化的推理追蹤,讓複雜的自主工作流程透明且易於除錯。不同於通用指令模型,它專為推理密集型任務(如競賽編程、算法設計、多步驟除錯)優化。
我可以在Claude Code以外的工具中使用Qwen3-235B-A22B-Thinking-2507嗎?
可以——它支援所有符合OpenAI API規範的工具。Trae(GUI IDE)、OpenCode(終端代理)、Cursor(程式碼編輯器)以及自訂Python/Node.js腳本,都可以透過Novita AI的https://api.novita.ai/v3/openai端點使用它。
我需要在本地運行Qwen3-235B-A22B-Thinking-2507時使用GPU嗎? 需要——FP8精度下預計需要4張H100 80GB顯卡。對大多數開發者而言,除非每月運行任務超過1萬個,否則使用Novita AI的API比自行部署更划算。
推薦閱讀
Novita AI 是一款AI與代理雲端平台,協助開發者與初創公司以高效能、高可靠性、高成本效益的方式構建、部署和擴展模型與自主應用程式。
