自 2025 年 5 月發布以來,DeepSeek R1 0528 已成為 AI 界最受關注的開源模型之一。這款擁有 6850 億參數 ** 的模型,效能可媲美頂級專有模型,其 ** 推理、編碼與數學能力 令開發者與研究人員讚嘆不已。
然而,隨著越來越多人爭相嘗試,一個關鍵問題不斷浮現: 執行這個龐大模型實際上要花多少錢?繼續看下去。
DeepSeek R1 0528 模型卡
DeepSeek R1 0528 於 2025 年 5 月 28 日發布,是一款功能強大的開源 AI 模型,以先進的推理能力、卓越的效能和成本效益著稱。
主要特色
- 規模: 6850 億參數(超越 OpenAI o3)。
- 開源: 基於 MIT 授權完全開源;權重可在 Hugging Face 取得。
- 架構: 採用混合專家(MoE)技術,動態啟用參數,提升效率。
- 語言支援: 英文與中文表現最佳。
- 多模態能力: 僅限文字(不支援圖片/音訊輸入)。
- 訓練改善: 透過最佳化的後訓練方法,增強推理與推論能力。
效能亮點
-
推理與程式設計:
-
在進階數學、邏輯與程式設計任務上表現優異。
-
數學基準測試:
- HMMT 2025:Pass@1 從 41.7% 提升至 79.4%。
- AIME 2025:Pass@1 從 70.0% 提升至 87.5%。
-
程式設計基準測試:
- Codeforces-Div1 評分:1530 → 1930。
- Aider-Polyglot 準確率:53.3% → 71.6%。
- LiveCodeBench Pass@1:63.5% → 73.3%。
-
-
除錯與程式碼生成:
- 在程式碼生成過程中自我修正,減少錯誤。
-
思維鏈推理:
- 提供逐步推理,提升準確性與透明度。
-
工具整合:
- 支援 JSON 輸出與函式呼叫的 API 整合。
- Tau-Bench Pass@1 分數:Airline(53.5%)、Retail(63.9%)。
-
減少幻覺:
- 提升關鍵應用的可靠性。
部署選項
-
完整模型(685B):
- 需要 24 張 NVIDIA H100 GPU(每張 80GB)、512GB–1TB RAM 以及穩固的基礎設施。
-
蒸餾版本(Qwen3 8B):
- 可在單張 NVIDIA RTX 4090 GPU(24GB VRAM)上運行。
DeepSeek R1 0528 API 成本
何時使用 API?
當你符合以下情況時,適合使用 API:
- 你不想進行任何設定或維護基礎設施
- 你正在執行批次推理或微調任務
- 你偏好隨需、可擴展的工作負載
- 你重視以 Token 計價(輸入/輸出)
DeepSeek R1 0528 API 定價比較
| 提供商 | 輸入($/百萬 Token) | 輸出($/百萬 Token) |
|---|---|---|
| Novita AI | 0.70 | 2.50 |
| Fireworks AI | 3.00 | 8.00 |
| Nebius AI Studio | 0.80 | 2.40 |
| Parasail | 0.79 | 4 |
✅ Novita AI 提供最低的 API Token 成本。非常適合對成本敏感且需擴展的任務,如 LLMOps、大量推論或非互動式批次管線。
API 使用指南
要開始使用,只需使用以下程式碼片段:
- 統一端點:
/v3/openai支援 OpenAI 的 Chat Completions API 格式。 - 彈性控制: 可調整 temperature、top-p、penalties 等參數,獲得客製化結果。
- 串流與批次: 選擇偏好的回應模式。
立即試用 DeepSeek R1 0528 Fast API
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="session_Ntg-O34ZOS-q5bNnkb3IcixmWnmxEQBxwKWMW3es3CD7KG4PEhFE1yRTRMGS3s8zZ52hrMdz14MmI4oalaDJTw==",
)
model = "deepseek/deepseek-r1-0528"
stream = True # or False
max_tokens = 2048
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
你也可以在第三方平台上串接 DeepSeek R1 0528 API
- Hugging Face:透過 Novita AI 端點在 Spaces、pipeline 或 Transformers 函式庫中使用 DeepSeek R1 0528。
- Agent 與編排框架: 使用官方連接器及逐步整合指南,輕鬆將 Novita AI 與夥伴平台如 Continue、AnythingLLM、LangChain、Dify 及 Langflow 串接。
- 相容 OpenAI API: 無痛遷移並整合至如 Cline 與 Cursor 等工具,專為 OpenAI API 標準設計。
DeepSeek R1 0528 GPU 雲端成本
何時使用 GPU 實例?
使用雲端 GPU 的時機:
- 你需要完整控制模型執行
- 你想執行自訂微調
- 你需要長時間的工作階段或持續的推論伺服器
- 你使用量化模型或加速框架
GPU 租用定價比較(每小時)
| 提供商 | GPU 型號 | 價格/小時 |
|---|---|---|
| Novita AI | A100 SXM | $1.60 |
| H100 SXM | $2.41 | |
| H200 SXM | $2.99 | |
| Lambda Cloud | H100 SXM | $3.29 |
| RunPod | A100 SXM | $1.74 |
| H100 SXM | $2.69 | |
| H200 | $3.99 | |
| Fireworks AI | H100 | $5.8 |
| H200 | $6.99 |
✅ 就成本效益而言,Novita AI 是各 GPU 類型的最佳提供商,而 A100 GPU 對使用者來說是最經濟實惠的選擇。
雲端 GPU 使用指南
步驟 1:註冊帳戶
透過我們的網站建立您的 Novita AI 帳戶。註冊後,移至左側邊欄的「探索」區塊,查看我們的 GPU 方案並開啟您的 AI 開發之旅。

步驟 2:探索範本與 GPU 伺服器
從 PyTorch、TensorFlow 或 CUDA 等範本中選擇符合您專案需求的範本。接著選擇偏好的 GPU 配置——選項包括強大的 L40S、RTX 4090 或 A100 SXM4,各有不同的 VRAM、RAM 與儲存規格。

步驟 3:自訂部署
選擇偏好的作業系統與配置選項,自訂您的環境,確保針對特定 AI 工作負載與開發需求達到最佳效能。

步驟 4:啟動執行個體
選擇「啟動執行個體」開始部署。您的效能 GPU 環境將在幾分鐘內準備就緒,讓您能立即開始機器學習、渲染或運算專案。

DeepSeek R1 0528 本地部署成本
何時需要本地部署?
僅在以下情況考慮 本地部署:
- 你需要 完整的資料控制權
- 你已經擁有 機房等級的基礎設施
- 你計劃執行 大規模、持續推論
- 你是研究實驗室或企業,預算達 數百萬美元
本地部署完整 DeepSeek R1 0528 的預估成本
| 組件 | 規格/數量 | 成本(美元) |
|---|---|---|
| NVIDIA A100 GPU | 116 × A100 80GB | $2,577,251.96 |
| 伺服器節點(雙 A100) | 58 × $50K | $2,900,000 |
| InfiniBand 網路 | 高速光纖 | $100,000 |
| NVMe SSD 儲存(100TB) | 4–6GB/s 讀寫 | $20,000 |
| 液冷 + 機架 | 企業級系統 | $80,000 + $10,000 |
| 軟體與授權 | 框架 + 作業系統 | $10,000 |
| 電力基礎設施 | UPS + 電力配送 | $50,000 |
| 電費(每年) | 每 GPU 700W | $50,000 |
| 維護與支援 | 年約 | $100,000 |
| **總計預估 ** | $589 萬以上 |
DeepSeek R1 0528 與其他模型比較
DeepSeek R1 0528 與其他模型:價格
| 模型 | 輸入成本($/百萬 Token) | 輸出成本($/百萬 Token) |
|---|---|---|
| DeepSeek R1 0528 | 0.70 | 2.50 |
| Gemini 2.5 Pro | 1.25–2.50 | 10–15 |
| OpenAI o3-pro | 20.00 | 80.00 |
DeepSeek R1‑0528 與其他模型:效能

DeepSeek R1 0528 效能接近頂級模型,卻能達到最高 32 倍的價格降低,是當前市場上最具成本效益的選擇。
結論
無論您是建構可擴展的 AI 管線、微調模型,還是將 LLM 部署至生產環境,Novita AI 上的 DeepSeek R1 0528 都能提供最具成本效益且靈活的解決方案,且無需負擔基礎設施。
| 使用情境 | 最佳選擇 | 原因 |
|---|---|---|
| 批次推論/Token 效率 | Novita AI API | 最低的輸入/輸出成本 |
| 長時間執行/微調任務 | Novita AI GPU | 最低的 GPU 租用時數費率 |
| 私有、安全、大規模運作 | 本地部署(預算允許時) | 完全控制,高度複雜 |
| 需要高準確率與成本控制 | DeepSeek R1 0528 | 價格完勝 Gemini/OpenAI |
常見問題
微調 DeepSeek R1 0528 的成本是多少?
自建基礎設施的預估成本約為 **589 萬美元 **。然而,使用 Novita AI 的雲端 GPU 可大幅降低前期成本,H100 GPU 每小時最低 $2.41 美元。
如何確保微調後的模型符合我的需求?
準備 乾淨、相關的資料集,並使用 **LoRA 適配器 ** 或 PEFT 方法 來有效率地微調模型的特定層。這樣可在不造成過擬合的情況下確保高效能。
我可以在 Novita AI 上部署微調後的模型嗎?
可以。Novita AI 支援將微調後的模型部署為 專用端點,並提供自動擴展、多 LoRA 設定及 API 整合等選項,讓您在應用程式中順暢使用。
Novita AI 是一個 AI 雲端平台,為開發者提供透過簡單 API 部署 AI 模型的簡易方式,同時也提供價格實惠且可靠的 GPU 雲端來建置與擴展。
