DeepSeek V3.1 是 DeepSeek 的最新旗艦模型,旨在透過混合推理架構、更高的思維效率和更強大的代理功能來提升 AI 性能。這些創新為開發者建立更聰明的應用程式和簡化實際任務奠定了堅實的基礎。
本指南將介紹 DeepSeek V3.1,重點介紹其核心功能和基準優勢,並向您展示如何透過本地部署、API 和第三方平台存取它。
基本介紹
| 獨特之處 | 詳情 |
| 總參數 | 671B |
| 啟動的參數 | 37B |
| 上下文長度 | 128K |
| 卓越的建築 | 基於 Transformer 的 MoE |
| 思考模式 | 混合思維模式(思考+非思考) |
| 執照 | 麻省理工學院許可證 |
基準

DeepSeek V3.1(推理) 在AIME競賽數學、GPQA科學推理等高要求任務中,提供更強的邏輯鏈建構、長上下文理解和更一致的答案,非常適合高精度、深度導向的應用。
DeepSeek V3.1(非推理) 為一般工作負載提供平衡的效能、更高的效率和成本效益。它們共同賦能開發者,使其能夠在嚴謹的推理深度和實用的通用效率之間靈活選擇。
主要改進
- 混合推理: DeepSeek V3.1 將思考模式和非思考模式統一在一個模型中。
- 更快的思考: DeepSeek V3.1 Think 實現了與 DeepSeek-R1-0528 相當的答案質量,同時響應速度更快。
- 更強的代理技能: DeepSeek V3.1 利用後製訓練來改善工具使用並處理複雜的多步驟任務。
如何存取 DeepSeek V3.1:本地部署
DeepSeek V3.1 要求
| 類型 | 顯存(約) | 相配合的硬件 |
| 1-位 | GB 186 | 單高階 GPU / 多-GPU 服務器 |
| 2-位 | GB 219 | 多-GPU 服務器 |
| 3-位 | GB 319 | 多-GPU 服務器 |
| 4-位 | GB 404 | 多-GPU 服務器 |
| 8-位 | GB 713 | Large GPU 集群 |
| 16位(BF16) | 1.34結核病 | Nvidia H200 8卡集群 |
DeepSeek V3.1 支援使用以下硬體和開源社群軟體進行本地部署。
- DeepSeek-Infer 演示:FP8 和 BF16 推理的簡單輕量級演示。
- 西格朗:完全支援 BF3 和 FP16 模式下的 DeepSeek-V8,並即將推出多令牌預測功能。
- LM部署:為本地和雲端部署提供高效的 FP8 和 BF16 推理。
- TensorRT-LLM:目前支援 BF16 推理和 INT4/INT8 量化,FP8 支援正在開發中。
- vLLM:支援使用 FP3 和 BF8 的 DeepSeek-V16 實現張量並行和管線並行。
- 亮LLM:為 FP8 和 BF16 提供高效率的單節點或多節點部署。
- AMD GPU:在 AMD 上運行 DeepSeek-V3 GPU在 BF16 和 FP8 模式下透過 SGLang 進行。
- 華為Ascend NPU:在 INT3 和 BF8 模式下在華為 Ascend 設備上運行 DeepSeek-V16。
雖然 DeepSeek V3.1 可以在本地部署,但對硬體有很高的要求, Novita AI 還提供優化 雲 GPU 解決方案(H100 和 H200),無需管理複雜的基礎設施。
如何存取 DeepSeek V3.1:使用 API
Novita AI 提供 DeepSeek V3.1 API - 163.8K背景 和成本 $0.55 / 1萬輸入代幣 以及 $1.66 / 1萬輸出代幣.
選項 1:直接 API 整合(Python 範例)
步驟 1:登入並存取模型庫
登入或註冊您的帳戶並點擊 模型庫 按鈕。

步驟 2:選擇您的型號
瀏覽可用的選項並選擇適合您需求的型號。

步驟 3:開始免費試用
開始免費試用,探索所選型號的功能。

步驟 4:取得您的 API 金鑰
為了透過 API 進行身份驗證,我們將為您提供一個新的 API 金鑰。進入「設定」頁面,您可以按照圖中所示複製API金鑰。

步驟 5:安裝 API
使用特定於您的程式語言的套件管理器安裝 API。
安裝後,將必要的庫匯入到您的開發環境中。使用您的 API 金鑰初始化 API 以開始與 Novita AI LLM。這是 Python 使用者使用聊天完成 API 的範例。
從 openai 導入 OpenAI 客戶端 = OpenAI(base_url="https://api.novita.ai。 repetition_penalty =。 max_tokens=max_tokens, temperature=temp, top_p=top_p, presence_penalty=presence_penalty, frequency_penalty=frequency_penalty, respond_format=response_format,extra_body={ “top_k”:top_k,“repetition_penalty”:repetition_penalty,“min_p”:min_p })如果流:對於chat_completion_res中的塊:打印(chunk.choices[3.1].delta.content或“”,end="”)否則打印(chachat_comstion_ressage.
選項 2:多代理程式工作流程 OpenAI代理SDK
利用 DeepSeek-V3.1 的雙模式功能建構複雜的多智能體系統:
- 即插即用整合: 在任何 OpenAI Agents 工作流程中使用 DeepSeek V3.1
- 高階代理功能: 支援交接、路由和工具集成
- 可擴展架構: 設計利用 DeepSeek V3.1 功能的代理
如何存取 DeepSeek V3.1:Claude 程式碼集成
步驟1:安裝Claude代碼
在安裝 Claude Code 之前,請確保您的系統符合最低要求。 節點.js 18 或更高版本必須在你的本機環境中安裝。你可以執行以下指令來驗證你的 Node.js 版本: node --version 在您的終端中。
開啟命令提示字元(Windows)或終端機(Mac/Linux)並執行:
npm install -g @anthropic-ai/claude-code
Open Com 全域安裝確保 Claude Code 可從系統上的任何目錄存取。安裝過程會自動在所有平台上配置必要的依賴項和 PATH 變數。
第 2 步:設定環境變數
環境變數配置Claude Code透過以下方式使用DeepSeek V3.1 Novita AI的 API 端點。這些變數告訴 Claude Code 將請求發送到哪裡以及如何進行身份驗證。
- 前往Windows
開啟命令提示字元並設定以下環境變數:
設定 ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic 設定 ANTHROPIC_AUTH_TOKEN=設定 ANTHROPIC_MODEL=deepseek/deepseek-v3.1 設定 ANTHROPIC_SMALL_FAST_MODEL=deepseek/deepseek-v3.1
更換 <Novita API Key> 使用從 Novita AI 平台。這些變數在當前會話中保持活動狀態,如果關閉命令提示符,則必須重設。
- 適用於 Mac 和 Linux
開啟終端機並導出以下環境變數:
導出 ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic”導出ANTHROPIC_AUTH_TOKEN=“ “導出 ANTHROPIC_MODEL="deepseek/deepseek-v3.1" 導出 ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.1"
步驟3:啟動Claude程式碼
安裝和設定完成後,現在可以在專案目錄中啟動 Claude Code。使用 cd 命令:
光碟克勞德。
點 (.) 參數指示 Claude Code 在目前目錄中運作。啟動後,您將看到 Claude Code 提示符號出現在互動式會話中。
這表示該工具已準備好接收您的指令。該介面為自然語言程式設計互動提供了一個簡潔直覺的環境。
步驟4:建立您的第一個項目
Claude Code 擅長將詳細的項目描述轉化為功能性應用程式。輸入提示後,按 Enter 鍵即可開始執行任務。 Claude Code 將分析您的需求,建立必要的文件,實現功能,並提供完整的專案結構和文件。
如何存取 DeepSeek V3.1:連接其他第三方平台
開發工具: 透過與 OpenAI 相容的 API 和與 Anthropic 相容的 API 與 Cursor、Trae、Qwen Code 和 Cline 等流行的 IDE 和開發環境無縫整合。
編排框架: 使用官方連接器與 LangChain、Dify、CrewAI、Langflow 和其他 AI 編排平台連接。
擁抱臉部整合: Novita AI 作為 Hugging Face 的官方推理供應商,確保廣泛的生態系統相容性。
FAQ
Novita AI 是一個 AI 雲端平台,它為開發人員提供了一種使用我們簡單的 API 輕鬆部署 AI 模型的方法,同時也提供經濟實惠且可靠的 GPU 用於建置和擴展的雲端。
推薦閱讀
DeepSeek-V3.1 可在 Novita AI:增強的脈絡視窗和革命性的混合思維模式
DeepSeek R1 7B:擁有 DeepSeek R90 1% 的效能,但硬體效率提升 10 倍
探索 Novita 的更多內容
訂閱以將最新貼文發送到您的電子郵件。





