現今開發者在構建結合視覺與程式碼的智慧應用程式時,面臨日益複雜的挑戰。傳統僅支援文字的模型在 UI 理解、版面配置翻譯和結構化視覺推理方面表現不佳。Qwen3-VL-235B-A22B 透過強大的多模態設計,整合視覺感知與程式設計邏輯,填補了這項缺口。
讀者不僅能了解 Qwen3-VL-235B-A22B 如何勝過 GLM-4.5V 等同類模型,還能學會如何在 Cursor、Trae、Codex 等開發環境中高效使用它。
什麼是 Qwen3-VL-235B-A22B?
模型類型: Qwen3 系列的多模態(視覺-語言)大型模型。
架構: 混合專家(MoE)架構,總參數約 235B,每次推理啟動約 22B 參數。
上下文長度: 支援最多 256K tokens,可擴展至 1M tokens。
視覺能力: 擅長 GUI 元素識別、截圖轉程式碼(HTML/CSS/JS/Draw.io),以及 2D/3D 空間推理。
語言表現: 在理解與推理能力上與純文字 LLM 持平,同時能無縫整合視覺輸入。
OCR 與多語言: 支援 32 種語言,在模糊、傾斜或低光環境下仍有優異表現。
變體:
- Instruct — 針對互動任務與對話最佳化。
- Thinking — 針對延伸推理與思路鏈推理調整。
Qwen3-VL-235B-A22B 在 OCR、GUI 推理與程式碼生成 領域領先,展現廣泛的多模態能力。其劣勢主要在於複雜的 3D 空間定位與主觀對齊任務。總體而言,它是目前基準測試中表現最均衡、效能最高的視覺-語言模型之一。

資料來源:Qwen
如何使用 Qwen3-VL-235B-A22B 快速建立程式碼演示?
Qwen3-VL-235B-A22B 在視覺化程式碼生成方面展現出無與倫比的實力。它在 Design2Code 基準測試中拿下 92.0 分、ChartMimic 中拿下 80.5 分的紀錄,能精確將複雜的介面、圖表與儀表板轉換為整潔、可執行的程式碼。
Novita AI 提供的 API 支援 32.8K 上下文長度,輸入 token 每 1K 收費 0.98 美元,輸出 token 每 1K 收費 3.95 美元。其效能表現優異,平均延遲僅 1.17 秒,吞吐量達 26.78 TPS(每秒 token 數)。
如何開發 Qwen3-VL-235B-A22B 的程式碼能力?
視覺轉程式碼流程的提示工程
- 首先指示模型詳細描述 UI 或圖表圖片,再要求生成程式碼。(技術:描述鏈)
- 提供清晰的「截圖 → HTML/CSS/JS」轉換範例,讓模型學習模式對應。
工具與代理整合
- 讓模型能呼叫程式碼編輯工具:開啟檔案、套用差異、執行測試。將其作為互動式「助理」而非靜態程式碼生成器使用。
- 循環執行「規劃 → 執行 → 觀察 → 修正」,透過 linting/測試的實際回饋,讓模型透過環境持續進步。
程式碼語料庫的微調 / 指令微調
- 收集「UI 截圖 + 目標程式碼 + 測試」資料集,混合推理對話與程式碼生成任務,對模型進行微調(或使用 LoRA)。
- 混合推理任務與程式碼任務,讓模型保留邏輯與執行理解能力。
長上下文與多檔案感知
- 運用模型的大上下文視窗(最多 256K tokens)輸入整個專案:多個檔案、依賴項、介面規格。
- 納入跨檔案參考與任務規格,確保輸出的程式碼符合上下文且正確無誤。
評估與迭代
- 使用「將 UI mockup 轉換為程式碼」這類任務進行基準測試(指標:正確性、UI 保真度、執行時間)。
- 監控錯誤類型(版面配置不符、邏輯錯誤、遺失依賴項),並據此迭代資料集與提示詞。
如何存取 Qwen3-VL-235B-A22B?
1. 網頁介面(最適合初學者)

2. API 存取(適合開發者)
步驟 1:登入並存取模型庫
登入您的帳號,點擊 模型庫 按鈕。

步驟 2:選擇模型
瀏覽可用的選項,選擇符合您需求的模型。

步驟 3:開始免費试用
開始免費试用,探索所選模型的能力。

步驟 4:取得 API 金鑰
若要使用 API 進行驗證,我們會提供給您新的 API 金鑰。進入「設定」頁面,即可按照圖片指示複製 API 金鑰。

步驟 5:安裝 API
使用對應程式語言的套件管理器安裝 API。
安裝完成後,將必要的程式庫匯入您的開發環境。使用您的 API 金鑰初始化 API,即可開始與 Novita AI LLM 互動。以下是为 Python 使用者提供的聊天完成 API 呼叫範例:
curl "https://api.novita.ai/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer session_edv1fJHNhzoHlVygGK0VnwTpo2gxM4nMxwcg-Wp0sEDOr0f-lQSFbRWwqOUMyXhtRQHShteDw48v2QNP86fLPA==" \
-d @- << 'EOF'
{
"model": "qwen/qwen3-vl-235b-a22b-thinking",
"messages": [
{
"role": "system",
"content": "Be a helpful assistant"
},
{
"role": "user",
"content": "Hi there!"
}
],
"response_format": { "type": "text" },
"max_tokens": 16384,
"temperature": 1,
"top_p": 1,
"min_p": 0,
"top_k": 50,
"presence_penalty": 0,
"frequency_penalty": 0,
"repetition_penalty": 1
}
EOF
3. 本地部署或專屬端點
需求:
- Qwen3-VL-235B-A22B:需 8 張 NVIDIA H200 顯示卡。
安裝步驟:
- 從 HuggingFace 或 ModelScope 下載模型權重
- 選擇推理框架:支援 vLLM 或 SGLang
- 按照官方 GitHub 儲存庫中的部署指南操作
當您需要穩定高效能的推理、自訂模型控制,以及在持續或高負載 workload 下更低的成本時,應選擇專屬端點,無需自行維護本地顯示卡與基礎設施。

4. 程式碼代理工具整合
使用 Novita AI 的服務,即可繞過 Claude Code 的地區限制。Novita AI 也提供了 Trae 與 Qwen Code 的存取指南,可參閱以下文章。
Novita 還提供 99% 服務穩定度的 SLA 保證,非常適合程式碼生成、自動測試等高頻率使用場景。
除了 Deepseek 0324 之外,使用者還能存取 Kimi-k2、Qwen3 Coder 等強大的程式碼模型,這些模型的效能接近 Claude 的封閉源碼 Sonnet 4,但費用不到其五分之一。
第一步:取得 API 金鑰

在 Cursor 中使用 Qwen3-VL-235B-A22B
步驟 1:安裝並啟用 Cursor
- 從 cursor.com 下載最新版本的 Cursor IDE
- 訂閱 Pro 方案以啟用基於 API 的功能
- 開啟應用程式並完成初始設定
步驟 2:存取進階模型設定

- 開啟 Cursor 設定(可使用 Ctrl + F 快速搜尋)
- 前往左側選單的 「模型」 分頁
- 找到 「API 設定」 區塊
步驟 3:設定 Novita AI 整合
- 展開 「API 金鑰」 區塊
- ✅ 啟用 「OpenAI API 金鑰」 開關
- ✅ 啟用 「覆寫 OpenAI 基底 URL」 開關
- 在 「OpenAI API 金鑰」 欄位中:貼上您的 Novita AI API 金鑰
- 在 「覆寫 OpenAI 基底 URL」 欄位中:將預設值替換為
https://api.novita.ai/openai
步驟 4:新增多個 AI 程式碼模型
點擊 「+ 新增自訂模型」 並逐一新增以下模型:
qwen/qwen3-vl-235b-a22b-thinkingzai-org/glm-4.6deepseek/deepseek-v3.1moonshotai/kimi-k2-0905openai/gpt-oss-120bgoogle/gemma-3-12b-it
步驟 5:測試整合

- 在 詢問模式 或 代理模式 中開啟新對話
- 針對不同的程式碼任務測試不同模型
- 確認所有模型都能正常回覆
在 Claude Code 中使用 Qwen3-VL-235B-A22B
Windows 系統
開啟命令提示字元,並設定以下環境變數:
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL=qwen/qwen3-vl-235b-a22b-thinking
set ANTHROPIC_SMALL_FAST_MODEL=qwen/qwen3-vl-235b-a22b-thinking
將 <[Novita API 金鑰](https://novita.ai/settings/key-management)> 替換為您從 Novita AI 平台取得的實際 API 金鑰。這些變數僅在當前工作階段生效,關閉命令提示字元後需要重新設定。
Mac 與 Linux 系統
開啟終端機,並匯出以下環境變數:
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="qwen/qwen3-vl-235b-a22b-thinking"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3-vl-235b-a22b-thinking"
啟動 Claude Code
完成安裝與設定後,您現在可以在專案目錄中啟動 Claude Code。使用 cd 指令導航至您想要的專案位置:
cd <your-project-directory>
claude .
在 Trae 中使用 Qwen3-VL-235B-A22B
步驟 1:開啟 Trae 並存取模型
啟動 Trae 應用程式。點擊右上角的「切換 AI 側邊欄」按鈕開啟 AI 側邊欄,接著前往 AI 管理並選擇「模型」。


步驟 2:新增自訂模型並選擇 Novita 作為供應商
點擊 新增模型 按鈕建立自訂模型條目。在新增模型對話框中,從下拉選單選擇 供應商 = Novita。


步驟 3:選擇或輸入模型
從模型下拉選單中挑選您想要的模型(DeepSeek-R1-0528、Kimi K2、DeepSeek-V3-0324、MiniMax-M1-80k、GLM 4.6)。如果找不到確切的模型,直接輸入您從 Novita 模型庫記下的模型 ID 即可。請確保選擇您要使用的正確模型變體。
在 Codex 中使用 Qwen3-VL-235B-A22B
設定配置檔案
Codex CLI 使用 TOML 配置檔案,位置如下:
- macOS/Linux:
~/.codex/config.toml - Windows:
%USERPROFILE%\.codex\config.toml
基本配置範本
model = "qwen/qwen3-vl-235b-a22b-thinking"
model_provider = "novitaai"
[model_providers.novitaai]
name = "Novita AI"
base_url = "https://api.novita.ai/openai"
http_headers = {"Authorization" = "Bearer YOUR_NOVITA_API_KEY"}
wire_api = "chat"
啟動 Codex CLI
codex
基本使用範例
程式碼生成:
> Create a Python class for handling REST API responses with error handling
專案分析:
> Review this codebase and suggest improvements for performance
錯誤修復:
> Fix the authentication error in the login function
測試:
> Generate comprehensive unit tests for the user service module
5. 第三方平台整合
- OpenAI 相容 API: 可無縫遷移並整合至 Cline、Cursor 等工具,這些工具皆以 OpenAI API 標準設計。
- Hugging Face: 可透過 Novita AI 端點在 Hugging Face Spaces、pipeline 中使用 Modeis,或搭配 Transformers 程式庫使用。
- 代理與編排框架: 可透過官方連接器與逐步整合指南,輕鬆將 Novita AI 與合作夥伴平台如 Continue、AnythingLLM,LangChain、Dify 和 Langflow 連接。
Qwen3-VL-235B-A22B 在視覺化程式碼生成、OCR 與推理基準測試中展現領先效能,重新定義了多模態程式設計標準。搭配 Novita AI 的 32.8K 上下文 API、彈性的部署方式(本地或專屬端點),以及與現代程式碼代理的整合,該模型能以具競爭力的成本提供高精度與高擴展性。
常見問題
Qwen3-VL-235B-A22B 在多模態模型中有什麼獨特之處? 它結合了 235B 參數的混合專家架構與強大的視覺推理能力,在 Design2Code 與 ChartMimic 基準測試中達到最先進的結果。
如何提升 Qwen3-VL-235B-A22B 的程式碼能力? 運用描述鏈提示詞、整合程式碼編輯工具、使用 UI 轉程式碼資料集進行微調,並利用其 256K token 的上下文進行多檔案推理。
Qwen3-VL-235B-A22B 可以整合到 IDE 中嗎? 可以。它可以透過 Novita AI 的 OpenAI 相容 API 端點,無縫整合至 Cursor、Codex 與 Trae 中。
Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 來部署 AI 模型,同時也提供實惠且可靠的 GPU 雲端服務,用於構建與擴展 AI 應用。
