如何存取 DeepSeek V3.1:完整指南

如何存取 DeepSeek V3.1:完整指南

DeepSeek V3.1 是 DeepSeek 最新的旗艦模型,採用混合推理架構,提高思考效率並強化代理能力,藉此推動 AI 效能前進。這些創新為開發者提供了強大的基礎,打造更聰明的應用程式並簡化真實世界的任務。

本指南將介紹 DeepSeek V3.1,重點說明其核心功能與基準測試優勢,並展示如何透過本地部署、API 及第三方平台存取它。

立即開始免費試用 DeepSeek V3.1 !

基本介紹

**功能 ** ** 詳細資訊**
總參數 671B
啟用參數 37B
上下文長度 128K
架構 基於 Transformer 的 MoE
思考模式 混合思考模式(Think + Non-Think)
授權條款 MIT 授權

基準測試

DeepSeek V3.1 的基準測試結果

DeepSeek V3.1 (推理) 在要求高的任務中,例如 AIME 競賽數學與 GPQA 科學推理,展現出更強的邏輯鏈構建、長上下文理解與更一致的答案,非常適合高精度、深度導向的應用。

DeepSeek V3.1 (非推理) 則在一般工作負載中提供均衡的效能,兼具更高的效率與成本效益。兩者共同賦予開發者彈性,可根據需求在嚴謹的推理深度與實用的通用效率之間做選擇。

主要改進

  • 混合推理: DeepSeek V3.1 在單一模型中融合 Think 與 Non-Think 模式。
  • 更快思考: DeepSeek V3.1 Think 達到與 DeepSeek-R1-0528 相當的答案品質,同時回應速度更快。
  • 更強的代理技能: DeepSeek V3.1 利用後訓練改善工具使用,並處理複雜的多步驟任務。

如何存取 DeepSeek V3.1:本地部署

DeepSeek V3.1 需求

**類型 ** VRAM (約略) ** 建議硬體**
1-bit 186 GB 單張高階 GPU / 多 GPU 伺服器
2-bit 219 GB 多 GPU 伺服器
3-bit 319 GB 多 GPU 伺服器
4-bit 404 GB 多 GPU 伺服器
8-bit 713 GB 大型 GPU 叢集
16-bit (BF16) 1.34 TB Nvidia H200 8 卡叢集

DeepSeek V3.1 支援使用以下硬體與開源社群軟體進行本地部署。

  • DeepSeek-Infer Demo: 一個簡單輕量的示範,適用於 FP8 與 BF16 推理。
  • SGLang: 完整支援 BF16 與 FP8 模式的 DeepSeek-V3,多 Token 預測即將推出。
  • LMDeploy: 提供高效能的 FP8 與 BF16 推理,適用於本地與雲端部署。
  • TensorRT-LLM: 目前支援 BF16 推理與 INT4/INT8 量化,FP8 支援即將推出。
  • vLLM: 支援 DeepSeek-V3 的 FP8 與 BF16,用於張量平行與管線平行。
  • LightLLM: 提供高效能的單節點或多節點 FP8 與 BF16 部署。
  • AMD GPU: 透過 SGLang 在 AMD GPU 上以 BF16 與 FP8 模式執行 DeepSeek-V3。
  • 華為昇騰 NPU: 在華為昇騰裝置上以 INT8 與 BF16 模式執行 DeepSeek-V3。

雖然 DeepSeek V3.1 需要大量硬體才能本地部署,但 Novita AI 也提供最佳化的 ** 雲端 GPU 解決方案(H100 與 H200)**,消除管理複雜基礎設施的需求。

如何存取 DeepSeek V3.1:使用 API

Novita AI 提供 DeepSeek V3.1 API 使用 163.8K 上下文 ,價格為 $0.55 / 1M 輸入 Tokens $1.66 / 1M 輸出 Tokens

選項 1:直接 API 整合(Python 範例)

步驟 1:登入並存取模型庫

登入或註冊您的帳號,然後點選 模型庫 按鈕。

顯示在 Novita AI 上尋找模型庫的位置

立即試用 DeepSeek V3.1 !

步驟 2:選擇您的模型

瀏覽可用的選項,並選擇符合您需求的模型。

在 Novita AI 上顯示 LLM 清單

步驟 3:開始免費試用

開始免費試用,探索所選模型的能力。

在 Novita API 上顯示 DeepSeek V3.1 Playground

步驟 4:取得您的 API 金鑰

為了向 API 進行身份驗證,我們將為您提供一個新的 API 金鑰。進入「設定」頁面,您可以複製 API 金鑰,如圖所示。

顯示在 Novita AI 上尋找 API 金鑰的位置

步驟 5:安裝 API

使用您程式語言專屬的套件管理器安裝 API。

安裝後,將必要的函式庫匯入您的開發環境。使用您的 API 金鑰初始化 API,開始與 Novita AI LLM 互動。以下是適用於 Python 使用者的聊天補全 API 範例。

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key="",
)

model = "deepseek/deepseek-v3.1"
stream = True # or False
max_tokens = 81920
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

選項 2:使用 OpenAI Agents SDK 進行多代理工作流程

利用 DeepSeek-V3.1 的雙模式能力,建立複雜的多代理系統:

  • 即插即用整合: 在任何 OpenAI Agents 工作流程中使用 DeepSeek V3.1
  • 進階代理能力: 支援移交、路由與工具整合
  • 可擴展架構: 設計能發揮 DeepSeek V3.1 能力的代理

如何存取 DeepSeek V3.1:Claude Code 整合

步驟 1:安裝 Claude Code

安裝 Claude Code 前,請確保您的系統滿足最低需求。您的本地環境必須安裝 Node.js 18 或更高版本。您可以在終端機中執行 node --version 來確認 Node.js 版本。

開啟命令提示字元(Windows)或終端機(Mac/Linux)並執行:

npm install -g @anthropic-ai/claude-code

全域安裝可確保 Claude Code 能從系統的任何目錄存取。安裝程序會自動在所有平台上配置必要的相依性與 PATH 變數。

步驟 2:設定環境變數

環境變數可設定 Claude Code 透過 Novita AI 的 API 端點使用 DeepSeek V3.1。這些變數告訴 Claude Code 將請求傳送到何處以及如何進行身份驗證。

  • Windows

開啟命令提示字元並設定下列環境變數:

set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL=deepseek/deepseek-v3.1
set ANTHROPIC_SMALL_FAST_MODEL=deepseek/deepseek-v3.1

<Novita API Key> 替換為您從 Novita AI 平台取得的實際 API 金鑰。這些變數在目前工作階段中保持有效,若關閉命令提示字元則須重新設定。

  • Mac 與 Linux

開啟終端機並匯出下列環境變數:

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.1"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.1"

步驟 3:啟動 Claude Code

完成安裝與設定後,您可以在專案目錄中啟動 Claude Code。使用 cd 命令導航至所需的專案位置:

cd <your-project-directory>
claude .

點號 (.) 參數指示 Claude Code 在目前目錄中運作。啟動後,您會看到 Claude Code 提示符號出現在互動式工作階段中。

這表示該工具已準備好接收您的指令。此介面提供一個乾淨、直覺的環境,供自然語言程式設計互動使用。

步驟 4:建立您的第一個專案

Claude Code 擅長將詳細的專案描述轉換為功能性應用程式。輸入您的提示後,按下 Enter 鍵開始執行任務。Claude Code 會分析您的需求、建立必要的檔案、實作功能,並提供完整的專案結構與文件。

如何存取 DeepSeek V3.1:連接其他第三方平台

開發工具: 透過 OpenAI 相容 API 與 Anthropic 相容 API,無縫整合至熱門的 IDE 與開發環境,例如 Cursor、Trae、Qwen Code 與 Cline。

編排框架: 使用官方連接器連接 LangChain、Dify、CrewAI、Langflow 及其他 AI 編排平台。

Hugging Face 整合: Novita AI 是 Hugging Face 的官方推理提供商,確保廣泛的生態系統相容性。

常見問答

Novita AI 是一個 AI 雲端平台,為開發者提供簡單的 API 來輕鬆部署 AI 模型,同時也提供價格實惠且可靠的 GPU 雲端,用於建置和擴展。

推薦閱讀

DeepSeek-V3.1 現已於 Novita AI 上線:強化上下文視窗與革命性混合思考模式

DeepSeek R1 7B:DeepSeek R1 的 90% 效能,但硬體效率提升 10 倍

DeepSeek V3 0324 現已於 Novita AI 上線