在Claude Code中使用Qwen3-235B-A22B-Thinking:節省80%成本

在Claude Code中使用Qwen3-235B-A22B-Thinking:節省80%成本

開發自主編碼助手時,開發者正面臨一個關鍵抉擇:要麼為Claude Sonnet 4.5這類封閉模型支付每百萬輸出代幣3至15美元的費用,要麼轉向承諾以極低成本提供相近能力的開放式推理模型。 阿里巴巴推出的Qwen3-235B-A22B-Thinking-2507打破了這一取捨,它配備專屬的「思考模式」,可提供推理性能,透過Novita AI的售價僅為每百萬輸入/輸出代幣0.30/3.00美元。

本指南將一步步講解如何將Qwen3-235B-A22B-Thinking-2507整合至Claude Code——這是一款符合Anthropic規範的終端代理,可實現自主編碼工作流程。你將看到這個235B參數的MoE模型(每代幣僅激活22B參數)如何利用Claude Code豐富的工具環境,透過擴展推理追蹤自動化複雜編碼任務。

立即試用Qwen3-235B-A22B-Thinking-2507!

Qwen3-235B-A22B-Thinking-2507是否真的具備強推理能力?

Qwen3-235B-A22B-Thinking-2507是Qwen3系列中最新的支援思考的模型,推理能力有重大突破。它在邏輯問題解決、數學、科學分析、編碼和學術評估等領域表現優異,性能達到甚至超越人類專家水平,在開源推理模型中表現位居前列。除了推理優勢外,它還提升了通用能力,包括更精確的指令遵循、先進的工具整合、高度自然的文本生成,以及更符合人類意圖的對齊效果。該模型還支援長達131K代幣的擴展上下文,可連貫且深入地處理長篇文件和複雜討論。

架構與能力

技術參數 規格 說明
模型類型 因果語言模型 基於Transformer架構
總參數 235B 每代幣激活22B參數
非嵌入參數 234B 實際計算參數
層數 94層 深度神經網絡結構
注意力頭 Q:64,KV:4 使用GQA機制
專家數量 128 MoE架構設計
激活專家數 8 動態專家選擇
上下文長度 262,144代幣 原生長上下文支援

基準測試性能(推理任務)

Qwen3-235B-A22B-Thinking-2507基準測試性能對比圖

來源:Hugging Face

Qwen3-235B-A22B-Thinking-2507在推理密集型與知識密集型任務中表現優異,尤其在數學、多語言知識、文件/影片理解方面尤為突出。在複雜認知與理解類基準測試中,其性能始終能與更大規模的模型競爭。

成本與代幣效率

Qwen3-235B-A22B-Thinking-2507的售價為每百萬輸入代幣0.30美元、每百萬輸出代幣3.00美元,與Claude Sonnet 4.5(每百萬代幣3/15美元)相比,輸入成本節省90%,輸出成本節省80%。對於需要擴展推理的任務,該模型最多可輸出81K代幣——這意味著單個複雜任務的輸出代幣成本僅為0.24美元,而使用Claude則需1.22美元。

Qwen3 235B A22b Thinking 2507 價格低廉

立即試用Qwen3-235B-A22B-Thinking-2507!

為何Qwen3-235B-A22B-Thinking-2507與Claude Code是最佳搭配?

Claude Code是Anthropic發布的基於終端的自主編碼介面。它透過調用工具(文件編輯、bash命令、搜尋)、跨任務管理上下文、以及根據反饋迭代,來協調多步驟工作流程。Qwen3-235B-A22B-Thinking-2507的顯式推理追蹤與這種自主範式完美契合——模型在執行工具調用前會先展示其規劃步驟,讓複雜工作流程易於除錯且透明可追溯。

1. 針對自主互動優化

Qwen3-235B-A22B-Thinking-2507的設計目標是執行操作、使用工具、管理多步驟任務。它的思考模式會輸出結構化的推理鏈,符合Claude Code對「規劃→執行→驗證」工作流程的預期。當模型規劃對5個文件進行重構時,你可以在任何文件編輯發生前看到逐步推理過程。

2. 豐富的工具鏈與API支援

Claude Code預先配置了對文件系統操作、bash執行、grep/搜尋、git命令以及外部工具整合的存取。Qwen3系列模型支援工具調用架構、JSON模式和函數定義——可無縫調用Claude Code的工具套件,完成自動化測試、部署腳本、多文件重構等任務。

3. 實時反饋循環

該模型的思考模式實現了自適應除錯:如果工具調用失敗(例如測試套件報錯),推理追蹤會顯示模型的假設內容,讓你可以會話中修正錯誤認知。這對於自主工作流程至關重要,因為早期錯誤可能會在20多個步驟中連鎖擴散。

4. 擴展輸出以應對複雜推理

像是「重構8個文件中的認證流程」或「整合分析器除錯內存洩漏」這類Claude Code任務,需要輸出10K+代幣的多步驟計劃。Qwen3-235B-A22B-Thinking-2507支援最多81K代幣的複雜推理,遠超普通模型限制,同時成本可控(輸出81K代幣僅需0.24美元,而Claude需1.22美元)。

如何在Claude Code中使用Qwen3-235B-A22B-Thinking-2507

Novita AI提供了符合Anthropic規範的API端點,這意味著只需透過簡單的環境變數配置,即可讓Claude Code與Qwen3-235B-A22B-Thinking-2507協同工作,無需修改任何程式碼。該模型配備256K上下文窗口,且每百萬輸入/輸出代幣售價僅為0.30/3.00美元,非常適合長時間編碼場景。

前置條件——取得Novita AI API金鑰

步驟1: 在Novita AI註冊免費帳號並登入。 步驟2: 進入模型庫,搜尋qwen/qwen3-235b-a22b-thinking-2507步驟3: 點擊開始免費試用以啟用存取權限(Novita會為新用戶提供試用額度)。 步驟4: 前往**設定 → API金鑰**,點擊生成API金鑰,並複製該金鑰。 步驟5: 使用以下Python測試驗證API連線:

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="qwen/qwen3-235b-a22b-thinking-2507",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=32768,
    temperature=0.7
)

print(response.choices[0].message.content)

你將看到模型的回覆中,推理追蹤被封裝在<think>標籤內。

立即試用Qwen3-235B-A22B-Thinking-2507!

Claude Code設定指南

步驟1:安裝Claude Code

#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash

#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex

#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd

Windows系統需要安裝Git for Windows 若尚未安裝,請先完成安裝。

步驟2:設定環境變數

Claude Code使用4個環境變數來將API請求路由至Novita AI:

#For macOS/Linux (Bash/Zsh):
# 設定Novita提供的符合Anthropic SDK的API端點。
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# 設定Novita提供的模型。
export ANTHROPIC_MODEL="qwen/qwen3-235b-a22b-thinking-2507"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3-235b-a22b-thinking-2507"

#For Windows (PowerShell):
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Novita API Key"
$env:ANTHROPIC_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"
$env:ANTHROPIC_SMALL_FAST_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"

說明:

  • ANTHROPIC_BASE_URL:將Claude Code指向Novita的符合Anthropic規範的端點
  • ANTHROPIC_AUTH_TOKEN:你的Novita API金鑰(非Anthropic金鑰)
  • ANTHROPIC_MODEL:複雜任務的主要模型(思考模式)
  • ANTHROPIC_SMALL_FAST_MODEL:快速操作的備用模型(若希望推理行為一致,可設定為與主模型相同)

步驟3:啟動Claude Code

前往你的專案目錄並啟動Claude Code:

cd <your-project-directory>
claude .

你將在互動式會話中看到Claude Code的提示符。遇到複雜查詢時,模型的思考模式會自動啟動。

示例任務:

> 重構認證模組以使用JWT令牌替代會話,更新所有5個相關文件並新增單元測試。

Claude Code會分析請求,調用Qwen3-235B-A22B-Thinking-2507生成多步驟計劃(可在<think>區塊中查看),隨後執行文件編輯、編寫測試並驗證修改結果。

實用技巧: 對於重數學運算或算法設計任務,請在API呼叫中將max_tokens提升至131072,以發揮Qwen3-235B-A22B-Thinking-2507的擴展推理能力。如果Claude Code暴露了代幣限制設定,可透過其配置檔案修改此參數。

立即試用Qwen3-235B-A22B-Thinking-2507!

Qwen3-235B-A22B-Thinking-2507以遠低於封閉模型的成本,提供先進推理、長上下文處理和結構化多步驟規劃能力。結合Claude Code使用,可實現透明、易於除錯的自主編碼工作流程,是追求高性能推理與編碼自動化、又不想承擔高昂代幣費用的開發者的實用解決方案。

總結

Qwen3-235B-A22B-Thinking-2507為Claude Code的自主工作流程帶來了擴展推理、透明的思路輸出和強大的工具使用能力,且成本遠低於封閉模型。對於執行複雜編碼任務的開發者而言,這一組合兼具性能與預算效率。

核心要點: 只需設定四個環境變數,將Claude Code指向Novita AI的符合Anthropic規範的端點,幾分鐘內即可運行先進推理工作流程。立即在Novita AI上試用Qwen3-235B-A22B-Thinking-2507,今天就開始構建吧。

Qwen3-235B-A22B-Thinking-2507與普通編碼模型有何不同? 它是一款純思考模型,會在生成程式碼前於<think>區塊中輸出結構化的推理追蹤,讓複雜的自主工作流程透明且易於除錯。不同於通用指令模型,它專為推理密集型任務(如競賽編程、算法設計、多步驟除錯)優化。

我可以在Claude Code以外的工具中使用Qwen3-235B-A22B-Thinking-2507嗎? 可以——它支援所有符合OpenAI API規範的工具。Trae(GUI IDE)、OpenCode(終端代理)、Cursor(程式碼編輯器)以及自訂Python/Node.js腳本,都可以透過Novita AI的https://api.novita.ai/v3/openai端點使用它。

我需要在本地運行Qwen3-235B-A22B-Thinking-2507時使用GPU嗎? 需要——FP8精度下預計需要4張H100 80GB顯卡。對大多數開發者而言,除非每月運行任務超過1萬個,否則使用Novita AI的API比自行部署更划算。

推薦閱讀

Novita AI 是一款AI與代理雲端平台,協助開發者與初創公司以高效能、高可靠性、高成本效益的方式構建、部署和擴展模型與自主應用程式。