DeepSeek V3.1 是 DeepSeek 最新的旗艦模型,採用混合推理架構,提高思考效率並強化代理能力,藉此推動 AI 效能前進。這些創新為開發者提供了強大的基礎,打造更聰明的應用程式並簡化真實世界的任務。
本指南將介紹 DeepSeek V3.1,重點說明其核心功能與基準測試優勢,並展示如何透過本地部署、API 及第三方平台存取它。
基本介紹
| **功能 ** | ** 詳細資訊** |
| 總參數 | 671B |
| 啟用參數 | 37B |
| 上下文長度 | 128K |
| 架構 | 基於 Transformer 的 MoE |
| 思考模式 | 混合思考模式(Think + Non-Think) |
| 授權條款 | MIT 授權 |
基準測試

DeepSeek V3.1 (推理) 在要求高的任務中,例如 AIME 競賽數學與 GPQA 科學推理,展現出更強的邏輯鏈構建、長上下文理解與更一致的答案,非常適合高精度、深度導向的應用。
DeepSeek V3.1 (非推理) 則在一般工作負載中提供均衡的效能,兼具更高的效率與成本效益。兩者共同賦予開發者彈性,可根據需求在嚴謹的推理深度與實用的通用效率之間做選擇。
主要改進
- 混合推理: DeepSeek V3.1 在單一模型中融合 Think 與 Non-Think 模式。
- 更快思考: DeepSeek V3.1 Think 達到與 DeepSeek-R1-0528 相當的答案品質,同時回應速度更快。
- 更強的代理技能: DeepSeek V3.1 利用後訓練改善工具使用,並處理複雜的多步驟任務。
如何存取 DeepSeek V3.1:本地部署
DeepSeek V3.1 需求
| **類型 ** | VRAM (約略) | ** 建議硬體** |
| 1-bit | 186 GB | 單張高階 GPU / 多 GPU 伺服器 |
| 2-bit | 219 GB | 多 GPU 伺服器 |
| 3-bit | 319 GB | 多 GPU 伺服器 |
| 4-bit | 404 GB | 多 GPU 伺服器 |
| 8-bit | 713 GB | 大型 GPU 叢集 |
| 16-bit (BF16) | 1.34 TB | Nvidia H200 8 卡叢集 |
DeepSeek V3.1 支援使用以下硬體與開源社群軟體進行本地部署。
- DeepSeek-Infer Demo: 一個簡單輕量的示範,適用於 FP8 與 BF16 推理。
- SGLang: 完整支援 BF16 與 FP8 模式的 DeepSeek-V3,多 Token 預測即將推出。
- LMDeploy: 提供高效能的 FP8 與 BF16 推理,適用於本地與雲端部署。
- TensorRT-LLM: 目前支援 BF16 推理與 INT4/INT8 量化,FP8 支援即將推出。
- vLLM: 支援 DeepSeek-V3 的 FP8 與 BF16,用於張量平行與管線平行。
- LightLLM: 提供高效能的單節點或多節點 FP8 與 BF16 部署。
- AMD GPU: 透過 SGLang 在 AMD GPU 上以 BF16 與 FP8 模式執行 DeepSeek-V3。
- 華為昇騰 NPU: 在華為昇騰裝置上以 INT8 與 BF16 模式執行 DeepSeek-V3。
雖然 DeepSeek V3.1 需要大量硬體才能本地部署,但 Novita AI 也提供最佳化的 ** 雲端 GPU 解決方案(H100 與 H200)**,消除管理複雜基礎設施的需求。
如何存取 DeepSeek V3.1:使用 API
Novita AI 提供 DeepSeek V3.1 API 使用 163.8K 上下文 ,價格為 $0.55 / 1M 輸入 Tokens 與 $1.66 / 1M 輸出 Tokens 。
選項 1:直接 API 整合(Python 範例)
步驟 1:登入並存取模型庫
登入或註冊您的帳號,然後點選 模型庫 按鈕。

步驟 2:選擇您的模型
瀏覽可用的選項,並選擇符合您需求的模型。

步驟 3:開始免費試用
開始免費試用,探索所選模型的能力。

步驟 4:取得您的 API 金鑰
為了向 API 進行身份驗證,我們將為您提供一個新的 API 金鑰。進入「設定」頁面,您可以複製 API 金鑰,如圖所示。

步驟 5:安裝 API
使用您程式語言專屬的套件管理器安裝 API。
安裝後,將必要的函式庫匯入您的開發環境。使用您的 API 金鑰初始化 API,開始與 Novita AI LLM 互動。以下是適用於 Python 使用者的聊天補全 API 範例。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="",
)
model = "deepseek/deepseek-v3.1"
stream = True # or False
max_tokens = 81920
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
選項 2:使用 OpenAI Agents SDK 進行多代理工作流程
利用 DeepSeek-V3.1 的雙模式能力,建立複雜的多代理系統:
- 即插即用整合: 在任何 OpenAI Agents 工作流程中使用 DeepSeek V3.1
- 進階代理能力: 支援移交、路由與工具整合
- 可擴展架構: 設計能發揮 DeepSeek V3.1 能力的代理
如何存取 DeepSeek V3.1:Claude Code 整合
步驟 1:安裝 Claude Code
安裝 Claude Code 前,請確保您的系統滿足最低需求。您的本地環境必須安裝 Node.js 18 或更高版本。您可以在終端機中執行 node --version 來確認 Node.js 版本。
開啟命令提示字元(Windows)或終端機(Mac/Linux)並執行:
npm install -g @anthropic-ai/claude-code
全域安裝可確保 Claude Code 能從系統的任何目錄存取。安裝程序會自動在所有平台上配置必要的相依性與 PATH 變數。
步驟 2:設定環境變數
環境變數可設定 Claude Code 透過 Novita AI 的 API 端點使用 DeepSeek V3.1。這些變數告訴 Claude Code 將請求傳送到何處以及如何進行身份驗證。
- Windows
開啟命令提示字元並設定下列環境變數:
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL=deepseek/deepseek-v3.1
set ANTHROPIC_SMALL_FAST_MODEL=deepseek/deepseek-v3.1
將 <Novita API Key> 替換為您從 Novita AI 平台取得的實際 API 金鑰。這些變數在目前工作階段中保持有效,若關閉命令提示字元則須重新設定。
- Mac 與 Linux
開啟終端機並匯出下列環境變數:
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.1"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.1"
步驟 3:啟動 Claude Code
完成安裝與設定後,您可以在專案目錄中啟動 Claude Code。使用 cd 命令導航至所需的專案位置:
cd <your-project-directory>
claude .
點號 (.) 參數指示 Claude Code 在目前目錄中運作。啟動後,您會看到 Claude Code 提示符號出現在互動式工作階段中。
這表示該工具已準備好接收您的指令。此介面提供一個乾淨、直覺的環境,供自然語言程式設計互動使用。
步驟 4:建立您的第一個專案
Claude Code 擅長將詳細的專案描述轉換為功能性應用程式。輸入您的提示後,按下 Enter 鍵開始執行任務。Claude Code 會分析您的需求、建立必要的檔案、實作功能,並提供完整的專案結構與文件。
如何存取 DeepSeek V3.1:連接其他第三方平台
開發工具: 透過 OpenAI 相容 API 與 Anthropic 相容 API,無縫整合至熱門的 IDE 與開發環境,例如 Cursor、Trae、Qwen Code 與 Cline。
編排框架: 使用官方連接器連接 LangChain、Dify、CrewAI、Langflow 及其他 AI 編排平台。
Hugging Face 整合: Novita AI 是 Hugging Face 的官方推理提供商,確保廣泛的生態系統相容性。
常見問答
Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 來輕鬆部署 AI 模型,同時也提供價格實惠且可靠的 GPU 雲端,用於建置和擴展。
推薦閱讀
DeepSeek-V3.1 現已於 Novita AI 上線:強化上下文視窗與革命性混合思考模式
