3 個 API 技巧，在 R2 到來前解鎖 DeepSeek 的潛力

DeepSeek R2 即將到來——但為什麼要等待？現在就用已有的模型搶佔先機吧！

當大家都在期盼 DeepSeek R2 時，聰明的開發者早已在 Novita AI 上使用 DeepSeek 現有的強大模型，佔據主導地位。

新用戶可獲得 10 美元免費額度，而推薦好友還能賺取最高 500 美元的 LLM API 獎勵！

目前 DeepSeek 陣容：

別再等待明天的模型——立刻透過 API 呼叫，部署改變遊戲規則的 AI。

DeepSeek V3、R1、V3 0324：相同架構

類別	詳細資訊
模型大小	671B 參數（每個 Token 啟用 37B）
架構	混合專家（Mixture of Experts, MoE）
開源	是（所有版本）
語言支援	多語言——擅長英文與中文
多模態	僅文字對文字
上下文視窗	128K tokens
版本	- DeepSeek R1：2025 年 1 月 21 日 - DeepSeek V3 0324：2025 年 3 月 24 日 - DeepSeek V3：2024 年 12 月 16 日

此外，DeepSeek V3 0324 融入了 DeepSeek-R1 所使用的強化學習技術的見解。

Novita AI 推出了 DeepSeek R1 Turbo，提供 **3 倍吞吐量 ** 以及 ** 限時 60% 折扣 。此外，此版本完全支援 ** 函式呼叫（function calling）。

更令人興奮的是：Novita AI 是 OpenRouter 上排名最高的 DeepSeek R1 API 之一。

DeepSeek-R1 在多項評測基準中表現優異，尤其在 HumanEval、MATH-500 和 MMLU-Pro 等任務中名列前茅。

o1 模型在多數任務中也有良好表現，並在某些任務中可與 DeepSeek-R1 相媲美。

整體而言，在大部分評測任務中，DeepSeek V3（2025 年 3 月）優於 DeepSeek V3（2024 年 12 月）。僅在 LiveCodeBench 編碼任務中，2024 年 12 月版本略佔優勢。

模型版本	約需 VRAM	GPU 配置	GPU 總記憶體
DeepSeek V3	1423.01 GB	24×H100（每張 80GB）	1920 GB
DeepSeek V3 0324	1532 GB	24×H100（每張 80GB）	1920 GB
DeepSeek R1（Base, 671B）	1854.43 GB	24×H100（每張 80GB）	1920 GB
DeepSeek-R1-Distill-Llama-8B	22.2 GB	1×RTX 4090（24GB）	24 GB
DeepSeek-R1-Distill-Qwen-14B	39 GB	2×RTX 4090（每張 24GB）	48 GB
DeepSeek-R1-Distill-Qwen-32B	88.99 GB	2×H100（每張 80GB）	160 GB
DeepSeek-R1-Distill-Llama-70B	194.14 GB	4×H100（每張 80GB）	320 GB

主要特色：

透過將 Novita AI 與 OpenAI Agents SDK 整合，建立進階多代理系統：

即插即用： 在任何 OpenAI Agents 工作流程中使用 Novita AI 的 LLM。
支援轉交、路由與工具使用： 設計可委派、分類或執行函式的代理，全部由 Novita AI 的模型驅動。
Python 整合： 只需將 SDK 指向 Novita 的端點（https://api.novita.ai/v3/openai）並使用您的 API 金鑰。

Hugging Face：透過 Novita AI 端點，在 Spaces、pipelines 或搭配 Transformers 函式庫使用 Qwen 3。

代理與編排框架： 透過官方連接器與逐步整合指南，輕鬆將 Novita AI 連接至 Continue、AnythingLLM、LangChain、Dify 與 Langflow 等合作平台。
OpenAI 相容 API： 無痛遷移並與 Cline 及 Cursor 等工具整合，專為 OpenAI API 標準設計。

雖然 DeepSeek V3、R1 與 0324 共享相同的底層模型架構，但其訓練方式導致效能與應用上的顯著差異。無論您是為了成本、硬體或特定任務品質而最佳化，了解這些細微差別有助於您選擇合適的模型。對開發者而言，Novita AI 在各大主流平台上提供了簡單、靈活且價格親民的存取方式。

哪個 DeepSeek 模型整體表現最好？

DeepSeek V3（2025 年 3 月）在平均基準測試中表現最佳，唯獨在 LiveCodeBench 中，2024 年 12 月版本略佔優勢。

所有版本都支援函式呼叫嗎？

是的——尤其是透過 Novita AI 的 R1 Turbo，使用 OpenAI 相容端點提供完整支援。

硬體需求如何？

完整模型需要 24×H100 GPU（約 1920 GB VRAM）；蒸餾版本可在單張 RTX 4090 或雙 H100 配置上運行。

*Novita AI *是一個 AI 雲端平台，讓開發者能夠透過簡單的 API 輕鬆部署 AI 模型，同時提供價格合理且可靠的 GPU 雲端來建構與擴展應用。