DeepSeek R2 即將到來——但為什麼要等待?現在就用已有的模型搶佔先機吧!
當大家都在期盼 DeepSeek R2 時,聰明的開發者早已在 Novita AI 上使用 DeepSeek 現有的強大模型,佔據主導地位。
新用戶可獲得 10 美元免費額度,而推薦好友還能賺取最高 500 美元的 LLM API 獎勵!
目前 DeepSeek 陣容:
- DeepSeek V3 0324: 輸入 $0.33 / M,輸出 $1.3 / M(128K 上下文)
- DeepSeek R1 Turbo: 輸入 $0.7 / M,輸出 $2.5 / M(64K 上下文)
- DeepSeek V3 Turbo: 輸入 $0.4 / M,輸出 $1.3 / M(64K 上下文)
別再等待明天的模型——立刻透過 API 呼叫,部署改變遊戲規則的 AI。
DeepSeek V3、R1、V3 0324:相同架構
| **類別 ** | ** 詳細資訊** |
|---|---|
| 模型大小 | 671B 參數(每個 Token 啟用 37B) |
| 架構 | 混合專家(Mixture of Experts, MoE) |
| 開源 | 是(所有版本) |
| 語言支援 | 多語言——擅長英文與中文 |
| 多模態 | 僅文字對文字 |
| 上下文視窗 | 128K tokens |
| **版本 ** | - DeepSeek R1:2025 年 1 月 21 日 - DeepSeek V3 0324:2025 年 3 月 24 日 - DeepSeek V3:2024 年 12 月 16 日 |
DeepSeek V3、R1、0324——真正的差異在於訓練

https://medium.com/@lixue421/deepseek-explained-8-post-training-of-deepseek-v3-6321d57f4fdf
此外,DeepSeek V3 0324 融入了 DeepSeek-R1 所使用的強化學習技術的見解。
DeepSeek V3、R1、0324:低成本與低延遲
Novita AI 推出了 DeepSeek R1 Turbo,提供 **3 倍吞吐量 ** 以及 ** 限時 60% 折扣 。此外,此版本完全支援 ** 函式呼叫(function calling)。
更令人興奮的是:Novita AI 是 OpenRouter 上排名最高的 DeepSeek R1 API 之一。
DeepSeek V3、R1 與 0324:與 GPT 的基準測試對決


DeepSeek-R1 在多項評測基準中表現優異,尤其在 HumanEval、MATH-500 和 MMLU-Pro 等任務中名列前茅。
o1 模型在多數任務中也有良好表現,並在某些任務中可與 DeepSeek-R1 相媲美。
整體而言,在大部分評測任務中,DeepSeek V3(2025 年 3 月)優於 DeepSeek V3(2024 年 12 月)。僅在 LiveCodeBench 編碼任務中,2024 年 12 月版本略佔優勢。
DeepSeek V3、R1 與 0324:較高的硬體需求
| 模型版本 | 約需 VRAM | GPU 配置 | GPU 總記憶體 |
|---|---|---|---|
| DeepSeek V3 | 1423.01 GB | 24×H100(每張 80GB) | 1920 GB |
| DeepSeek V3 0324 | 1532 GB | 24×H100(每張 80GB) | 1920 GB |
| DeepSeek R1(Base, 671B) | 1854.43 GB | 24×H100(每張 80GB) | 1920 GB |
| DeepSeek-R1-Distill-Llama-8B | 22.2 GB | 1×RTX 4090(24GB) | 24 GB |
| DeepSeek-R1-Distill-Qwen-14B | 39 GB | 2×RTX 4090(每張 24GB) | 48 GB |
| DeepSeek-R1-Distill-Qwen-32B | 88.99 GB | 2×H100(每張 80GB) | 160 GB |
| DeepSeek-R1-Distill-Llama-70B | 194.14 GB | 4×H100(每張 80GB) | 320 GB |
DeepSeek V3、R1 與 0324:3 種 API 存取方式
選項 1:直接 API 整合

主要特色:
- 統一端點:
/v3/openai支援 OpenAI Chat Completions API 格式。 - 彈性控制: 調整 temperature、top-p、penalties 等參數,獲得客製化結果。
- 串流與批次: 選擇您偏好的回應模式。
選項 2:搭配 OpenAI Agents SDK 的多代理工作流程
透過將 Novita AI 與 OpenAI Agents SDK 整合,建立進階多代理系統:
- 即插即用: 在任何 OpenAI Agents 工作流程中使用 Novita AI 的 LLM。
- 支援轉交、路由與工具使用: 設計可委派、分類或執行函式的代理,全部由 Novita AI 的模型驅動。
- Python 整合: 只需將 SDK 指向 Novita 的端點(
https://api.novita.ai/v3/openai)並使用您的 API 金鑰。
在第三方平台上連接 Qwen 3 API
- Hugging Face:透過 Novita AI 端點,在 Spaces、pipelines 或搭配 Transformers 函式庫使用 Qwen 3。

- 代理與編排框架: 透過官方連接器與逐步整合指南,輕鬆將 Novita AI 連接至 Continue、AnythingLLM、LangChain、Dify 與 Langflow 等合作平台。
- OpenAI 相容 API: 無痛遷移並與 Cline 及 Cursor 等工具整合,專為 OpenAI API 標準設計。
雖然 DeepSeek V3、R1 與 0324 共享相同的底層模型架構,但其訓練方式導致效能與應用上的顯著差異。無論您是為了成本、硬體或特定任務品質而最佳化,了解這些細微差別有助於您選擇合適的模型。對開發者而言,Novita AI 在各大主流平台上提供了簡單、靈活且價格親民的存取方式。
常見問題
哪個 DeepSeek 模型整體表現最好?
DeepSeek V3(2025 年 3 月)在平均基準測試中表現最佳,唯獨在 LiveCodeBench 中,2024 年 12 月版本略佔優勢。
所有版本都支援函式呼叫嗎?
是的——尤其是透過 Novita AI 的 R1 Turbo,使用 OpenAI 相容端點提供完整支援。
硬體需求如何?
完整模型需要 24×H100 GPU(約 1920 GB VRAM);蒸餾版本可在單張 RTX 4090 或雙 H100 配置上運行。
*Novita AI *是一個 AI 雲端平台,讓開發者能夠透過簡單的 API 輕鬆部署 AI 模型,同時提供價格合理且可靠的 GPU 雲端來建構與擴展應用。
