如何在 Novita AI GPU 实例上部署 DeepSeek-R1-0528-Qwen3-8B

如何在 Novita AI GPU 实例上部署 DeepSeek-R1-0528-Qwen3-8B

如果想執行一個僅 8B 參數的模型,卻能擊敗比它大 30 倍的模型,該怎麼辦?

DeepSeek-R1-0528-Qwen3-8B 帶來了突破性的推理表現,在複雜數學任務上可媲美 235B 參數的模型,同時僅需一張 RTX 4090 即可順暢運行。

本指南將教您如何在幾分鐘內於 Novita AI 上部署這款顛覆性的模型。

什麼是 DeepSeek-R1-0528-Qwen3-8B

DeepSeek-R1-0528-Qwen3-8B 是一款先進的推理模型,透過將 DeepSeek-R1-0528 的思維鏈能力蒸餾至 Qwen3 8B 基礎模型而成。這種創新方法造就了一個最先進的開源模型,在數學與推理基準測試中表現卓越,包括 AIME 2024,其成績超越 Qwen3 8B 達 +10.0%,並能與規模大得多的 Qwen3-235B-thinking 模型相匹敵。

該模型在各種評測指標上均展現出超凡能力:AIME 24 得分 86.0、AIME 25 得分 76.3、HMMT Feb 25 得分 61.5。這款模型的特別價值在於:它能提供與大規模模型相當的推理表現,同時保持 8B 參數模型的效率與易部署性。

DeepSeek-R1-0528-Qwen3-8B 基準測試

為什麼要在 Novita AI GPU 實例上執行 DeepSeek-R1-0528-Qwen3-8B?

1. 顯著的價格優勢與彈性計費模式

Novita AI 在 GPU 運算市場提供具競爭力的定價,讓研究人員、企業及各規模的開發者都能輕鬆使用 DeepSeek-R1-0528-Qwen3-8B 等先進 AI 模型。

可根據使用模式選擇 隨用隨付或訂閱方案。針對在 RTX 4090 上執行的 DeepSeek-R1-0528-Qwen3-8B:

  • 隨用隨付:每小時 $0.35 美元 — 適合測試與變動性工作負載
  • 1-5 個月:每月 $226.80 美元(9 折)— 中期專案
  • 6-11 個月:每月 $206.64 美元(82 折)— 較長開發週期
  • 12 個月:每月 $189.00 美元(75 折)— 長期承諾節省更多

年約訂閱可節省數百美元,同時確保資源的保證可用性。進一步了解計費方案

2. 多種 GPU 選擇以最佳化效能

Novita AI 提供全面的 GPU 選項,滿足您的運算需求與預算:

  • RTX 3090 24GB:開發與測試的經濟型選擇
  • RTX 4090 24GBDeepSeek-R1-0528-Qwen3-8B 的推薦選擇 — 效能與成本的平衡
  • RTX 5090 32GB
  • RTX 6000 Ada 48GB:更大 VRAM,支援更長上下文長度
  • L40S 48GB:專業級效能,記憶體容量更大
  • A100 SXM 80GB:高效能運算,記憶體頻寬充裕
  • H100 SXM 80GB:企業級效能,適用於生產部署

3. 即用型範本與客製彈性

針對 DeepSeek-R1-0528-Qwen3-8B 等熱門模型的 預配置範本 (如 DeepSeek-R1-0528-Qwen3-8B 範本)可省去手動設定的繁瑣過程,包括最佳化的容器配置、環境變數以及經過測試的部署參數。進階用戶可以建立完全自訂的範本,搭配專屬配置與個人化部署腳本,同時滿足初學者的易用性與經驗開發者的全面自訂需求。

4. 全球部署網路

透過 Novita AI 遍佈 15 個區域 的全球網路,在更接近用戶的位置部署 GPU 實例,涵蓋美洲(美國、加拿大、巴西)、亞太地區(日本、新加坡、印度、阿聯酋、香港)及歐洲(德國、英國)。此全球基礎設施可確保 DeepSeek-R1-0528-Qwen3-8B 部署的低延遲與可靠效能,無論用戶身在何處都能獲得穩定的服務。

如何在 Novita AI 上部署 DeepSeek-R1-0528-Qwen3-8B

步驟 1:選擇範本

從模型庫中選擇 DeepSeek-R1-0528-Qwen3-8B 範本。選擇一張 RTX 4090 作為 GPU 類型,然後點擊 Deploy

選擇 4090

步驟 2:確認參數

檢視配置畫面上顯示的部署參數。確認所有設定無誤後,點擊 Next 繼續。

使用範本

步驟 3:部署實例

點擊 Deploy 開始建立實例。系統將開始配置您的 GPU 實例。

部署範本

步驟 4:監控部署進度

導覽至 Instance Management 進入控制台。此儀表板可讓您即時查看部署狀態。

步驟 5:查看映像拉取狀態

點擊您的特定實例以監控容器映像的下載進度。根據網路狀況,此過程可能需要幾分鐘。

步驟 6:追蹤模型下載

實例啟動後,它將開始拉取模型。點擊 “Logs”“Instance Logs” 以監控模型的下載進度。

步驟 7:確認部署成功

在實例日誌中尋找 "Application startup complete." 訊息。這表示部署過程已成功完成。

步驟 8:取得存取 URL

點擊 “Connect”,然後點擊 “Connect to HTTP Service [Port 8000]”。由於這是 API 服務,您需要複製該位址。

網站 URL

步驟 9:存取已部署的模型

若要向您的模型發送請求,請將 http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai 替換為您的實際公開位址。複製以下程式碼即可存取您的私有模型!

# 使用 curl 呼叫伺服器:
curl -X POST "http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai/v1/chat/completions" \
        -H "Content-Type: application/json" \
        --data '{
                "model": "deepseek-ai/DeepSeek-R1-0528-Qwen3-8B",
                "messages": [
                        {
                                "role": "user",
                                "content": "What is the capital of France?"
                        }
                ]
        }'
{"id":"chatcmpl-56d12c91edbb46fcb93ccbbc0ecddd2c","object":"chat.completion","created":1748588145,"model":"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B","choices":[{"index":0,"message":{"role":"assistant","reasoning_content":null,"content":" thinking\
Okay, the user is asking for the capital of France. Let me start by recalling the basic answer. Paris is definitely the correct response, so I'll start with that.\
\
But why is the user asking this? They might be a student preparing for a test, or maybe someone traveling who needs to know the main city for planning. Alternatively, they could be testing my knowledge. But since it's a straightforward question, I'll focus on providing accurate information.\
\
Wait, maybe they need more context. Should I mention some points of interest to add value? Like Eiffel Tower or Louvre. That could help if they're interested in tourism or education. \
\
I should check if there's any recent political changes or administrative updates but nothing seems off with Paris' status as a capital. Alright, keep it simple but informative. Let me structure the answer first, then decide on the optional details. \
\
Also, considering the user might not want a long answer. But including key landmarks might make it more engaging. They didn't ask for historical info, so maybe just stick to the status and one or two unique facts. \
\
Yes, \"city of love\" is a common nickname, so that adds a nice touch. Alright, final answer will confirm Paris, mention the nicknames, and list two landmarks to cover possible interests without being overwhelming.\
 response\
The capital of France is **Paris**.","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":294,"completion_tokens":284,"prompt_tokens_details":null},"prompt_logprobs":null}

在您的應用程式(例如 Chatbox)中設定 API 位址,就能擁有自己的個人助理!

Novita AI 是一個 AI 雲端平台,為開發者提供使用簡單 API 部署 AI 模型的便捷方式,同時提供平價且可靠的 GPU 雲端服務,用於建置與擴展應用。