在 Claude Code 中使用 DeepSeek V4 Flash：透過 Novita AI 的設定指南

為什麼要在 Claude Code 中使用 DeepSeek V4 Flash
什麼是 DeepSeek V4 Flash
取得您的 Novita AI API 金鑰
安裝 Claude Code
設定環境變數
啟動 Claude Code
處理大型程式碼庫
依會話選擇推理模式
結論
常見問題
推薦文章

DeepSeek V4 Flash 是一個 284B 的 MoE 模型，擁有 100 萬 token 的上下文窗口，可透過 Novita AI 的 Anthropic 相容端點取得——這意味著 Claude Code 可以透過三行環境變數的更改直接使用它。輸入 token 每百萬 $0.14，相較於 Claude Sonnet 的每百萬 $3，對於運行連續自主編碼會話的團隊來說，成本差異非常顯著。

為什麼要在 Claude Code 中使用 DeepSeek V4 Flash

經濟效益是最直接的原因。Claude Code 預設使用 Claude Sonnet，輸入 token 每百萬 $3，輸出 token 每百萬 $15。Novita AI 上的 DeepSeek V4 Flash 成本為輸入每百萬 $0.14，輸出每百萬 $0.28——輸入約降低 20 倍，輸出約降低 50 倍。對於一個在八小時工作天中運行 Claude Code 的團隊，這個差異很快就會累積起來。

除了成本之外，V4 Flash 還帶來了兩項對自主編碼特別重要的功能：

100 萬 token 上下文窗口 —— Claude Code 可以將整個程式碼庫載入上下文，無需分塊。多檔案重構、跨儲存庫除錯以及長對話歷史都能保持連貫，無需手動管理上下文。
可選擇的推理模式 —— Non-think 模式為模板任務提供快速回應；Think 和 Think Max 模式則針對複雜的架構決策或困難的除錯會話啟用逐步推理。您可以根據會話選擇，無需切換模型。

Novita AI 公開了一個 Anthropic 相容的端點（/anthropic），因此 Claude Code 將其視為可直接替代的方案。無需 SDK 變更，無需外掛——只需環境變數。

什麼是 DeepSeek V4 Flash

DeepSeek V4 Flash 是 DeepSeek AI 的一個專家混合（MoE）模型。它擁有 284B 總參數，但每次前向傳遞僅啟用 13B，這使得延遲和每 token 成本接近 13B 的密集模型，同時保留了更大網路的知識容量。

快速瀏覽主要規格：

規格	數值
模型 ID	`deepseek/deepseek-v4-flash`
總參數	284B（每次推理啟用 13B）
上下文窗口	1,048,576 tokens
最大輸出 token	393,216
輸入價格（Novita AI）	$0.14/M tokens
輸出價格（Novita AI）	$0.28/M tokens
快取讀取價格	$0.028/M tokens
推理模式	Non-think、Think、Think Max
函式呼叫	是
結構化輸出	是
授權條款	MIT

這三種推理模式讓您可以根據會話調整成本與品質。Non-think 模式快速且便宜——適合重複性的框架建立或樣板生成。Think 模式加入逐步推理，適用於程式碼審查、架構工作和除錯。Think Max 使用最大的推理預算，在多數編碼基準上媲美 V4 Pro。

Novita AI 提供完整的 100 萬 token 上下文窗口和可靠的正常運行時間，使其成為生產環境自主工作負載的實用選擇。

取得您的 Novita AI API 金鑰

註冊 Novita AI 帳號即可獲得免費試用額度。登入後，前往金鑰管理頁面，然後點擊 「Create New Key」。

立即複製金鑰——它不會再次顯示。將它保存在密碼管理器或機密儲存庫中；您將在下個步驟中用到。

安裝 Claude Code

Claude Code 需要 Node.js 18 或更高版本。請先檢查您的版本：

node --version

如果 Node 版本低於 18，請先從 nodejs.org 更新後再繼續。

Windows

開啟命令提示字元並執行：

npm install -g @anthropic-ai/claude-code

Mac 與 Linux

開啟終端機並執行：

npm install -g @anthropic-ai/claude-code

全域安裝會讓 claude 可從任何目錄中使用。

設定環境變數

這四個變數會將 Claude Code 重新導向至 Novita AI 的 Anthropic 相容端點，並將 DeepSeek V4 Flash 設為使用中的模型。

Windows

set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Your Novita API Key>
set ANTHROPIC_MODEL=deepseek/deepseek-v4-flash
set ANTHROPIC_SMALL_FAST_MODEL=deepseek/deepseek-v4-flash

這些設定僅對目前的命令提示字元會話有效。若要永久保留，請透過 系統內容 → 環境變數 進行設定。

Mac 與 Linux

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Your Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v4-flash"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v4-flash"

若要跨會話永久保留，請將這些行加入您的 ~/.bashrc、~/.zshrc 或對應的 shell 設定檔中。

ANTHROPIC_SMALL_FAST_MODEL 控制 Claude Code 用於快速內部任務（如檔案查詢和摘要）的輕量模型。將其設定為相同的模型 ID 可將所有流量保留在單一帳單線上，並避免意外的 Anthropic API 呼叫。

啟動 Claude Code

導航到您的專案目錄並啟動 Claude Code：

cd <your-project-directory>
claude .

Claude Code 會在当前目錄開啟一個互動式會話。一旦與 Novita AI 的端點建立連線，您就會看到提示出現。從這裡開始，用自然語言描述您的任務——Claude Code 會讀取您的檔案、提出變更，並在您批准後套用。

處理大型程式碼庫

100 萬 token 的上下文窗口是 V4 Flash 相較於較小上下文替代方案最實用的優勢。一個典型的中型生產程式碼庫在扁平化後約有 100K–300K tokens。V4 Flash 可以將整個內容保持在上下文中，無需任何分塊策略。

以下幾個工作流程能直接受益：

跨檔案重構 —— 要求 Claude Code 重新命名資料模型、變更 API 合約，或重構所有引用該服務介面的檔案。由於擁有完整的上下文窗口，它可以同時看到所有依賴關係，而非逐個檔案查看。

長時間除錯會話 —— 隨著除錯會話累積工具呼叫、檔案讀取和推理軌跡，較小的上下文窗口會截斷早期歷史。V4 Flash 保留完整會話，因此模型可以推理它在 200 次工具呼叫前看到的模式。

全儲存庫審查 —— 將整個程式碼庫輸入 V4 Flash 的 Think 或 Think Max 模式，要求進行安全性審查、架構評估或無用程式碼分析。這會很快耗盡 128K 模型的容量；但它能輕鬆容納在 V4 Flash 的窗口內。

系統提示負擔 —— Claude Code 使用一個詳細的系統提示，可能佔用 10K–20K tokens。在 128K 模型上，這個負擔很重要。但在 100 萬的窗口上，它幾乎可以忽略不計，將幾乎所有的上下文預算留給實際程式碼。

對於長時間會話的成本控制，Non-think 模式以最低成本處理大部分例行檔案編輯。當任務需要設計推理時，切換到 Think 模式，而針對困難的演算法或除錯問題則使用 Think Max。Novita 快取讀取價格（$0.028/M）意味著重複的系統提示注入在大規模使用時成本極低。

依會話選擇推理模式

DeepSeek V4 Flash 支援三種推理模式，您可以按會話控制。Non-think 模式返回快速、直接的完成內容——適合樣板生成、例行編輯和快速查詢。Think 模式啟用逐步推理，適用於程式碼審查、重構和架構決策。Think Max 分配最大的推理預算，並在多數編碼基準上媲美 V4 Pro。

讓 Claude Code 傾向更深層推理的最簡單方法是使用自訂系統提示：

claude --system "Use extended thinking for architecture decisions and complex debugging."

若要程式化控制，Novita AI 的端點接受 budget_tokens 參數。將其設為 0 會完全停用思考；任何正值則啟用思考，最多使用該 token 預算。這在僅特定步驟需要深度推理的自主管道中很有用：

import anthropic

client = anthropic.Anthropic(
    base_url="https://api.novita.ai/anthropic",
    api_key="<Your Novita API Key>",
)

# Think Max — maximum reasoning budget for hard problems
response = client.messages.create(
    model="deepseek/deepseek-v4-flash",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 10000},
    messages=[{"role": "user", "content": "Review this function for subtle concurrency bugs."}],
)

對於注重成本的會話，請從 Non-think 模式開始，僅在遇到需要它的問題時切換到 Think。由於 Novita 快取讀取價格為 $0.028/M tokens，即使在長篇的多步驟會話中，重複的系統提示注入仍然保持便宜。

結論

Novita AI 上的 DeepSeek V4 Flash 為 Claude Code 提供了強大且具成本效益的基礎——100 萬上下文、可選擇的推理和函式呼叫，價格僅為 Claude Sonnet 的一小部分。設定只需不到五分鐘。一旦環境變數就位，您現有的 Claude Code 工作流程將保持不變。

在 Novita AI 上試用 DeepSeek V4 Flash，並參閱 Novita AI LLM API 文件以取得更多設定選項。

常見問題

Claude Code 是否需要任何外掛或擴充功能才能使用 Novita AI？

不需要。Claude Code 在啟動時會讀取 ANTHROPIC_BASE_URL 環境變數，並將所有 API 呼叫路由到那裡。無需外掛、擴充功能或程式碼變更——完全透過環境變數切換。

使用 Novita AI 時，Anthropic 會向我收費嗎？

不會。當 ANTHROPIC_BASE_URL 指向 Novita AI 時，所有流量和帳單都透過您的 Novita AI 帳戶處理。您的 Anthropic 帳戶不會被使用。

我可以在不安裝的情況下切換回 Claude Sonnet 嗎？

可以。取消設定 ANTHROPIC_BASE_URL 和 ANTHROPIC_MODEL——或者開啟一個沒有這些匯出的新 shell——Claude Code 就會恢復為使用 Claude Sonnet 的預設 Anthropic 端點。

V4 Flash 適合自動化 CI 管道嗎？

V4 Flash 支援函式呼叫和結構化輸出，這是 Claude Code 最依賴的兩項功能。對於自動化編碼管道、CI 整合以及上下文連續性和成本可預測性很重要的長時間自主會話來說，它是一個實用的選擇。

如果上下文窗口滿了會發生什麼事？

在 1,048,576 tokens 的情況下，V4 Flash 的上下文窗口足夠大，大多數會話不會填滿它。如果您正在執行極長的會話——累積了數天的歷史記錄、非常大的儲存庫——Claude Code 將開始截斷最舊的訊息。實際上，為新任務開始一個新的會話是保持在限制內最簡單的方法。

Novita AI 是一個 AI 雲端平台，為開發者提供使用我們簡單 API 部署 AI 模型的簡便方式，同時也為建置和擴展提供經濟實惠且可靠的 GPU 雲端。 *

在 Claude Code 中使用 DeepSeek V4 Flash：透過 Novita AI 的設定指南

為什麼要在 Claude Code 中使用 DeepSeek V4 Flash

什麼是 DeepSeek V4 Flash

取得您的 Novita AI API 金鑰

安裝 Claude Code

Windows

Mac 與 Linux

設定環境變數

Windows

Mac 與 Linux

啟動 Claude Code

處理大型程式碼庫

依會話選擇推理模式

結論

常見問題

推薦文章

Product

RESOURCES

Partners

Company

為什麼要在 Claude Code 中使用 DeepSeek V4 Flash

什麼是 DeepSeek V4 Flash

取得您的 Novita AI API 金鑰

安裝 Claude Code

Windows

Mac 與 Linux

設定環境變數

Windows

Mac 與 Linux

啟動 Claude Code

處理大型程式碼庫

依會話選擇推理模式

結論

常見問題

推薦文章

相關文章

Product

RESOURCES

Partners

Company