如何在 Novita AI GPU 实例上部署 DeepSeek-R1-0528-Qwen3-8B

如何在 Novita AI GPU 实例上部署 DeepSeek-R1-0528-Qwen3-8B

如果你能运行一个 8B 参数模型,而其性能超越比它大 30 倍的模型,会怎样?

DeepSeek-R1-0528-Qwen3-8B 带来了突破性的推理性能,在复杂的数学任务上媲美 235B 参数模型,同时能够在一张 RTX 4090 上高效运行。

本指南将向你展示如何在几分钟内将这个改变游戏规则的模型部署到 Novita AI 上。

什么是 DeepSeek-R1-0528-Qwen3-8B

DeepSeek-R1-0528-Qwen3-8B 是一个先进的推理模型,它通过将 DeepSeek-R1-0528 的思维链能力蒸馏到 Qwen3 8B Base 模型中而诞生。这一创新方法产生了一个最先进的开源模型,在数学与推理基准测试上取得了显著成绩,其中包括 AIME 2024,其表现超过 Qwen3 8B 达 +10.0%,并能与规模大得多的 Qwen3-235B-thinking 模型相匹敌。

该模型在多项评估指标上展现了卓越能力:AIME 24 得分 86.0,AIME 25 得分 76.3,HMMT Feb 25 得分 61.5。该模型尤其可贵之处在于,它能在提供与更大模型相当的推理性能的同时,保持 8B 参数模型的高效性与易部署性。

DeepSeek-R1-0528-Qwen3-8B 基准测试

为什么选择在 Novita AI GPU 实例上运行 DeepSeek-R1-0528-Qwen3-8B?

1. 显著的价格优势与灵活的定价模式

Novita AI 提供市场上具有竞争力的 GPU 算力价格,让研究人员、企业和各类规模的开发者都能轻松使用 DeepSeek-R1-0528-Qwen3-8B 等先进的 AI 模型。

你可以根据使用模式在 “按需付费”“订阅” 模式之间进行选择。对于在 RTX 4090 上运行的 DeepSeek-R1-0528-Qwen3-8B:

  • 按需付费:$0.35/小时——适合测试和波动性工作负载
  • 1-5 个月:$226.80/月(9 折)——中期项目
  • 6-11 个月:$206.64/月(82 折)——延长开发周期
  • 12 个月:$189.00/月(75 折)——长期承诺带来更大节约

年度订阅可为你节省数百美元,同时确保资源的确定性。 了解更多定价模式

2. 多种 GPU 选择以优化性能

Novita AI 提供全面的 GPU 选项来满足你的计算需求和预算:

  • RTX 3090 24GB:开发与测试的经济之选
  • RTX 4090 24GBDeepSeek-R1-0528-Qwen3-8B 的推荐选择——性能与成本的最佳平衡
  • RTX 5090 32GB
  • RTX 6000 Ada 48GB:更大上下文长度所需的增强显存
  • L40S 48GB:专业级性能,拥有扩展内存容量
  • A100 SXM 80GB:高带宽内存的高性能计算
  • H100 SXM 80GB:企业级性能,适用于生产部署

3. 开箱即用的模板与自定义灵活性

预配置模板DeepSeek-R1-0528-Qwen3-8B 等流行模型消除了手动设置的复杂性,包括优化的容器配置、环境变量以及经过验证的部署参数。高级用户可以创建完全自定义的模板,使用专门的配置和个性化的部署脚本,既兼顾初学者的易用性,又满足经验丰富的开发者的全面定制需求。

4. 全球部署网络

通过 Novita AI 的全球网络,将 GPU 实例部署在更靠近用户的位置,覆盖 15 个区域 ,包括美洲(美国、加拿大、巴西)、亚太(日本、新加坡、印度、阿联酋、香港)和欧洲(德国、英国)。这套全球基础设施可确保你的 DeepSeek-R1-0528-Qwen3-8B 部署拥有更低的延迟和可靠的性能,无论用户身在何处,都能获得稳定的服务。

如何在 Novita AI 上部署 DeepSeek-R1-0528-Qwen3-8B

步骤 1:选择模板

从模型库中选择 DeepSeek-R1-0528-Qwen3-8B 模板。选择一张 RTX 4090 作为 GPU 类型,然后点击 部署

选择 4090

步骤 2:确认参数

检查配置屏幕上显示的部署参数。确认所有设置正确后,点击 下一步 继续。

使用模板

步骤 3:部署实例

点击 部署 启动实例创建过程。系统将开始为你配置 GPU 实例。

部署模板

步骤 4:监控部署进度

导航到 实例管理 进入控制台。该仪表板可让你实时跟踪部署状态。

步骤 5:查看镜像拉取状态

点击你的具体实例,监控容器镜像下载进度。根据网络状况,此过程可能需要几分钟。

步骤 6:跟踪模型下载

实例启动后,它将开始拉取模型。点击 “日志”“实例日志” 来监控模型下载进度。

步骤 7:验证部署成功

在实例日志中查找消息 "Application startup complete."。这表明部署过程已成功完成。

步骤 8:获取访问 URL

点击 “连接” ,然后点击 “连接到 HTTP 服务 [端口 8000]” 。由于这是一个 API 服务,你需要复制该地址。

网站 URL

步骤 9:访问已部署的模型

要向你的模型发出请求,请将 `http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai 替换为你实际的外部地址。复制以下代码即可访问你的私有模型!

# 使用 curl 调用服务器:
curl -X POST "http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai/v1/chat/completions" \
        -H "Content-Type: application/json" \
        --data '{
                "model": "deepseek-ai/DeepSeek-R1-0528-Qwen3-8B",
                "messages": [
                        {
                                "role": "user",
                                "content": "What is the capital of France?"
                        }
                ]
        }'
{"id":"chatcmpl-56d12c91edbb46fcb93ccbbc0ecddd2c","object":"chat.completion","created":1748588145,"model":"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B","choices":[{"index":0,"message":{"role":"assistant","reasoning_content":null,"content":" thinking\
Okay, the user is asking for the capital of France. Let me start by recalling the basic answer. Paris is definitely the correct response, so I'll start with that.\
\
But why is the user asking this? They might be a student preparing for a test, or maybe someone traveling who needs to know the main city for planning. Alternatively, they could be testing my knowledge. But since it's a straightforward question, I'll focus on providing accurate information.\
\
Wait, maybe they need more context. Should I mention some points of interest to add value? Like Eiffel Tower or Louvre. That could help if they're interested in tourism or education. \
\
I should check if there's any recent political changes or administrative updates but nothing seems off with Paris' status as a capital. Alright, keep it simple but informative. Let me structure the answer first, then decide on the optional details. \
\
Also, considering the user might not want a long answer. But including key landmarks might make it more engaging. They didn't ask for historical info, so maybe just stick to the status and one or two unique facts. \
\
Yes, \"city of love\" is a common nickname, so that adds a nice touch. Alright, final answer will confirm Paris, mention the nicknames, and list two landmarks to cover possible interests without being overwhelming.\
 response\
The capital of France is **Paris**.","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":294,"completion_tokens":284,"prompt_tokens_details":null},"prompt_logprobs":null}

在你的应用(如 Chatbox)中配置 API 地址,你就可以拥有自己的私人助手了!

Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 部署 AI 模型的便捷途径,同时提供经济可靠的 GPU 云用于构建和扩展。