管理大型程式碼庫或多文件工作流程的開發者,在使用傳統 Transformer 模型時,經常會遇到高運算成本、長上下文效能不穩定、程式碼理解不一致等長期存在的挑戰。這些限制會降低反覆運算效率、阻礙儲存庫規模的分析,同時增加營運成本。DeepSeek V3.2 的推出正是為了解決這些痛點,它整合了DeepSeek 稀疏注意力機制(DSA),該機制旨在降低注意力運算開銷、加速上下文推理,並穩定程式碼生成品質。
本文將深入探討 DeepSeek V3.2 如何提升成本效益、長上下文處理能力,以及針對程式碼任務的優化能力,同時提供透過 Novita AI 與 Claude Code 部署 DeepSeek V3.2 的實務操作指南。
請注意!Novita AI 正在舉辦「Build Month」活動,為開發者提供全線主打產品最高 20% 的專屬優惠!
DeepSeek V3.2 有哪些新的程式碼相關功能?
DSA 是一項革命性的注意力機制,從根本上改變了模型處理資訊的方式。傳統 Transformer 需要每個 token 都關注所有其他 token,導致二次方的運算成本(O(n²)),而 DSA 引入了細粒度、內容感知的選擇機制:
- 智慧過濾:訓練過程中,模型會學習辨識哪些 token 之間的關聯對特定任務真正重要
- 動態連線:根據輸入內容即時選擇必要的注意力連線
- 任務優化:處理程式碼與法律文件時,會聚焦於不同的結構模式
DSA 帶來的三大核心改進
直接自我適應(Direct Self-Adaptation)作為輔助機制,無需修改核心架構即可提升整體模型效能。透過這個方法,模型在保持與 v3.1 相當的程式碼生成與分析品質的前提下,實現更經濟的推論,大幅提升成本效益,支援更頻繁的測試與快速反覆運算。
DSA 同時強化長上下文的運用能力,可有效利用高達 128K token 的上下文視窗,提升同時進行多檔案分析、跨檔案依賴理解,以及複雜技術文件處理的能力。
此外,DSA 也提升了與程式碼相關的能力,包含更快的推論回應速度、更精準的程式碼理解,以及更穩定的程式碼生成品質,全面提升模型在大型軟體開發場景中的可靠度與效率。
可擴展的強化學習框架
透過採用穩健的強化學習協議,並擴大訓練後的運算規模,DeepSeek-V3.2 的效能已可比擬 GPT-5。其中高運算版本 DeepSeek-V3.2-Speciale 的表現持續優於 GPT-5,推理能力更與 Gemini-3.0-Pro 不相上下。
| Benchmark | Metric | DeepSeek-V3.2-Speciale | DeepSeek-V3.2-Thinking | GPT-5-High | Claude-4.5-Sonnet | Gemini-3.0-Pro |
|---|---|---|---|---|---|---|
| AIME 2025 | Pass@1 (%) | 96.0 | 93.1 | 94.6 | 87.0 | 95.0 |
| HMMT 2025 | Pass@1 (%) | 99.2 | 90.2 | 88.3 | 79.2 | 97.5 |
| HLE | Pass@1 (%) | 30.6 | 25.1 | 26.3 | 13.7 | 37.7 |
| Codeforces | Rating | 2701 | 2386 | 2537 | 1480 | 2708 |
| SWE Verified | Resolved (%) | – | 73.1 | 74.9 | 77.2 | 76.2 |
| Terminal Bench 2.0 | Accuracy (%) | – | 46.4 | 35.2 | 42.8 | 54.2 |
| τ² Bench | Pass@1 (%) | – | 80.3 | 80.2 | 84.7 | 85.4 |
| Tool Decathlon | Pass@1 (%) | – | 35.2 | 29.0 | 38.6 | 36.4 |
DeepSeek V3.2 為提升與開發者的協作體驗做了哪些優化?
為了將推理能力更好地整合到工具使用場景中,DeepSeek 在 V3.2 的後訓練階段引入了大規模智能體任務合成管線。核心思路是系統性地大規模生成智能體訓練資料,而非依賴手寫提示詞或有限的人類演示樣本。
這條管線會以程式方式構建需要模型進行推理、決策、呼叫工具、觀察中間結果,並據此調整行為的任務。透過讓模型接觸到各種結構化的互動場景,DeepSeek 實現了可擴展的智能體後訓練,大幅提升了模型在搜尋、編程、工具增強工作流程等複雜多步驟互動環境中的行為符合度與泛化能力。
最重要的兩項更新為:
重新設計的工具呼叫格式,在多人步驟互動中更明確、更穩定
原生支援**「邊思考邊使用工具」**,推理與工具使用是結構化整合,而非鬆散交錯
為了幫助社群理解並採用這個新模板,DeepSeek 提供了專屬的**encoding 資料夾**。這個資料夾包含 Python 腳本與測試案例,演示了如何將相容 OpenAI 的訊息編碼為 DeepSeek-V3.2 預期的單一輸入字串,以及如何將模型的文字輸出解析回結構化訊息。
import transformers
# encoding/encoding_dsv32.py
from encoding_dsv32 import encode_messages, parse_message_from_completion_text
tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")
messages = [
{"role": "user", "content": "hello"},
{"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
{"role": "user", "content": "1+1=?"}
]
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)
prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)
需要特別說明的是,本次版本沒有包含基於 Jinja 的聊天模板,提供的 Python 實現是唯一的權威參考。此外,輸出解析函數預設模型輸出是格式正確的,僅供演示與實驗使用,不建議在沒有額外錯誤處理的情況下直接用於生產環境。
為什麼需要 developer 角色?
在實際的智能體場景中,模型通常需要同時處理三種不同類型的資訊:
- 使用者的真實意圖或任務目標
- 模型自身的推理與決策流程
- 系統或開發者提供的搜尋策略、工具限制與執行規則
在更早的版本中,這些訊號通常會混合在使用者或系統提示詞中。久而久之導致了兩大問題:第一,模型可能難以區分使用者意圖與強制性的行為限制;第二,隨著工具鏈變得越來越複雜,工具呼叫的穩定性與可靠度明顯下降。
DeepSeek-V3.2 引入的 developer 角色本質上是搜尋型智能體與工具導向智能體的專屬控制通道。它用於傳遞與智能體行為嚴格相關的指令,例如搜尋範圍、工具使用順序、政策限制等,不會參與普通對話的語義運作。這種明確的劃分能讓上下文理解更清晰,也為更具擴展性、更穩健的智能體訓練奠定了結構基礎。
如何在 Claude Code 中使用 DeepSeek V3.2?
Novita AI 目前提供最實惠的完整上下文 DeepSeek V3.2 API。
Novita AI 提供的 API 支援 65K 上下文,價格為輸入 0.269 美元/百萬 token、輸出 0.4 美元/百萬 token,支援結構化輸出與函數呼叫,能充分發揮 DeepSeek V3.2 程式碼智能體的潛力。
快取讀取費用:0.1345 美元/百萬 token 指的是快取命中時讀取已快取 token 的成本。這些 token 已經過預先計算與儲存,因此不需要額外的模型推論。在多個請求共享相同提示詞前綴、重複使用對話歷史、工具指令或固定規則文本,或是 RAG 檢索結果高度重複的系統中,可以達到很高的快取命中率,大幅降低整體推論成本。
第一步:取得 API 金鑰
步驟 1:登入帳號後點擊「模型庫」按鈕。

步驟 2:選擇模型
瀏覽可用選項並選擇符合需求的模型。

步驟 3:開始免費試用
開始免費試用所選模型的功能。

步驟 4:取得 API 金鑰
要進行 API 身份驗證,我們會提供新的 API 金鑰。進入「設定」頁面後,即可按照圖中指示複製 API 金鑰。

步驟 5:安裝 API
使用對應程式語言的套件管理器安裝 API。安裝完成後,將必要的函式庫匯入您的開發環境,使用 API 金鑰初始化 API,即可開始與 Novita AI LLM 互動。以下為 Python 使用者呼叫聊天完成 API 的範例:
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="deepseek/deepseek-v3.2",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=65536,
temperature=0.7
)
print(response.choices[0].message.content)
在 Claude Code 中使用 DeepSeek V3.2
步驟 1:安裝 Claude Code
安裝 Claude Code 前,請確保您的系統符合最低需求:本地環境必須安裝 Node.js 18 或更高版本。您可以在終端機執行 node --version 指令來驗證 Node.js 版本。
Windows 系統
打開命令提示字元,執行以下指令:
npm install -g @anthropic-ai/claude-code
npx win-claude-code@latest
全域安裝能確保 Claude Code 在系統的任何目錄都能存取。npx win-claude-code@latest 指令會下載並執行最新版的 Windows 專用版本。
Mac 與 Linux 系統
打開終端機,執行:
npm install -g @anthropic-ai/claude-code
Mac 使用者可以直接進行全域安裝,不需要額外的平台專用指令。安裝過程會自動配置必要的依賴項與 PATH 變數。
步驟 2:設定環境變數
環境變數用於配置 Claude Code,使其透過 Novita AI 的 API 端點使用 DeepSeek v3.2。這些變數會告訴 Claude Code 要將請求發送到哪裡,以及如何進行身份驗證。
Windows 系統
打開命令提示字元,設定以下環境變數:
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
set ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"
請將 <Novita API Key> 替換為您在 Novita AI 平台取得的實際 API 金鑰。這些變數僅在當前工作階段生效,關閉命令提示字元後需要重新設定。
Mac 與 Linux 系統
打開終端機,匯出以下環境變數:
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"
步驟 3:啟動 Claude Code
完成安裝與配置後,您現在可以在專案目錄中啟動 Claude Code。使用 cd 指令導航到您要使用的專案位置:
cd <your-project-directory>
claude .
點(.)參數會指示 Claude Code 在當前目錄中執行。啟動後,您會在互動式工作階段中看到 Claude Code 的提示符號。
這表示工具已經準備好接收您的指令,介面提供了簡潔直觀的環境,適合自然語言程式設計互動。
步驟 4:在 VSCode 或 Cursor 中使用 Claude Code
Claude Code 能與主流開發環境無縫整合,它會強化您現有的工作流程,而非取代它。
您可以直接在 VSCode 或 Cursor 的終端機中使用 Claude Code,這樣既能保留您熟悉的開發工具,又能享受 AI 輔助的好處。
此外,VSCode 與 Cursor 都有對應的 Claude Code 外掛程式可供使用。
如何在 Claude Code 中使用外部模型?
如果您希望在開發工作流程中動態切換不同的大語言模型(例如 Anthropic 的 Claude、智譜的 GLM、月之暗面的 Kimi),且不需要大幅修改程式碼,本節將說明如何透過統一 API 與配置切換快速更換模型。
使用環境變數(Claude Code 做法):
如果您使用的是 Claude Code 這類工具,或是綁定特定 API 的 SDK,只需調整環境配置即可切換模型。Novita AI 提供多種模型選項,您可以實驗後找到最適合的方案。

DeepSeek V3.2 透過引入 DSA 進行針對性的架構升級,在保持競爭力推理效能的同時,大幅降低了運算成本、提升了長上下文處理效率,並改善了以程式碼為核心的精確度。與 DeepSeek V3.1-Terminus 及同類封閉方案相比,該模型能實現大型儲存庫與複雜技術文件的可擴展分析,展現了效率與能力之間的優良平衡。這些技術突破使 DeepSeek V3.2 成為持續開發工作流程與長上下文 AI 應用的高性價比解決方案。
常見問題
DeepSeek V3.2 內建的 DeepSeek 稀疏注意力機制(DSA)的主要優勢是什麼?
DeepSeek V3.2 使用 DSA 選擇性啟動注意力連線,在降低二次方注意力運算成本的同時,維持長上下文下的精準程式碼理解能力。
在實際編程工作流程中,DeepSeek V3.2 與 DeepSeek V3.1-Terminus 有什麼差異?
與 DeepSeek V3.1-Terminus 相比,DeepSeek V3.2 擁有更低的營運成本、128K 上下文視窗,以及更快的推論穩定性,能實現更高效的儲存庫規模程式碼分析。
DeepSeek V3.2 是否提升了長上下文技術文件處理能力?
是的。DeepSeek V3.2 支援同時分析複雜文件與跨檔案關聯,在多文件推理任務中的表現優於 DeepSeek V3.1-Terminus。
Novita AI 是實現您 AI 抱負的一站式雲端平台,整合 API、無伺服器運算、GPU 實例等您需要的高性價比工具。免除基礎建設煩惱,免費開始使用,讓您的 AI 願景成為現實。
推薦閱讀
如何存取 Qwen 3 Coder:Qwen Code、Claude Code、Trae

