核心亮点
Novita AI 推出了 DeepSeek R1 Turbo,提供 **3 倍吞吐量 ** 和 ** 限时 60% 折扣 。此外,该版本完全支持 ** 函数调用。
您可以在 Novita AI 上开始免费试用!

更令人兴奋的是:Novita AI 的 DeepSeek R1 API 在 OpenRouter 上排名第一

什么是 DeepSeek R1?
- 发布日期:2025 年 1 月 21 日
- 模型规模:
- 主要特性:
- 模型大小:671B 参数(每个 token 激活 37B)
- 分词器:增强型分词器,带有自反思标签
- 支持语言:多语言,具备文化适应性
- 多模态:纯文本
- 上下文窗口:128K tokens
- 存储格式:支持 Q8/Q5 量化
- 架构:混合专家(MoE)+ RL 增强训练流程
- 训练方法:基于 V3 基础模型,采用 RL 流程(SFT → RL → SFT → RL)
- 训练数据:V3 基础数据 + RL 优化数据

基准测试

DeepSeek-R1 在大多数任务中展现出显著的性能提升,特别是在 Codeforces 和 GPQA Diamond 任务中分别提高了 9.0% 和 5.7%,展示了其在处理复杂任务方面的强大能力。
Deepseek R1 硬件需求
| 模型 | 精度 | GPU | 数量 |
|---|---|---|---|
| DeepSeek-R1-Distill-Qwen-1.5B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-7B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Llama-8B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-14B | BF16 | RTX 4090 | 2 |
| DeepSeek-R1-Distill-Qwen-32B | BF16 | RTX 4090 | 4 |
| DeepSeek-R1-Distill-Llama-70B | BF16 | RTX 4090 | 8 |
| DeepSeek-R1 (671B) | BF16 | H100 | 8 |
DeepSeek-R1 的硬件需求层次分明:
- 蒸馏模型 硬件需求相对较低,尤其是中小规模模型,适合高端消费级硬件(例如 RTX 4090)。
- 完整模型 对硬件要求极高,尤其是超大规模模型,依赖于专业级硬件(例如 H100 GPU)。
- 总体而言,蒸馏技术显著降低了硬件需求,增强了模型部署的灵活性,但完整模型仍需要非常高的性能硬件才能达到峰值性能。
如果您觉得购买 GPU 或自行部署过于复杂,您可以使用 **Novita AI 的 GPU 和 API 服务 **,其中提供了完全优化的 DeepSeek-R1 版本。它非常便捷,并按 token 数量收费。
选择 Novita AI 的云端 GPU 服务
Novita AI 是一个 AI 云平台,为开发者提供使用简单 API 部署 AI 模型的便捷方式,同时提供经济实惠且可靠的 GPU 云用于构建和扩展。
步骤 1:注册账户
如果您是 Novita AI 的新用户,请先在我们的网站上创建账户。注册后,前往“GPUs”标签页,浏览可用资源并开始您的旅程。

步骤 2: 探索模板和 GPU 服务器****
首先选择符合您项目需求的模板,例如 PyTorch、TensorFlow 或 CUDA。根据需求选择版本,如 PyTorch 2.2.1 或 CUDA 11.8.0。然后选择 A100 GPU 服务器配置,该配置提供强大的性能来处理高负载任务,并具备充足的显存、内存和磁盘容量。

步骤 3: 定制您的部署****
选择模板和 GPU 后,通过调整操作系统版本(如 CUDA 11.8)等参数来自定义部署设置。您还可以调整其他配置,以使环境满足项目的特定要求。

步骤 4: 启动 一个 实例****
完成模板和部署设置后,单击“启动实例”来设置您的 GPU 实例。这将启动环境配置,使您能够开始使用 GPU 资源进行 AI 任务。

选择 Novita AI 的 API 服务
Novita AI 是一个 AI 云平台,为开发者提供使用简单 API 部署 AI 模型的便捷方式,同时提供经济实惠且可靠的 GPU 云用于构建和扩展。
步骤 1:登录并访问模型库
登录您的账户,然后点击 模型库 按钮。

步骤 2:选择您的模型
浏览可用选项,选择适合您需求的模型。

步骤 3:开始免费试用
开始免费试用,探索所选模型的能力。

步骤 4:获取您的 API 密钥
为了通过 API 进行身份验证,我们将为您提供一个新的 API 密钥。进入“设置”页面,您可以按照图中指示复制 API 密钥。

步骤 5:安装 API
使用编程语言对应的包管理器安装 API。

安装后,将必要的库导入到您的开发环境中。使用您的 API 密钥初始化 API,开始与 Novita AI LLM 交互。以下是使用 Python 的聊天补全 API 示例:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Novita AI 通过 DeepSeek R1 Turbo 彻底改变了 AI 部署方式,提供 **3 倍吞吐量 ** 和对 ** 函数调用 ** 等高级功能的支持,现在还有 ** 限时 20% 折扣 **。无论您是在 RTX 4090 等消费级 GPU 上运行蒸馏模型,还是在企业级 H100 GPU 上部署完整模型,Novita AI 都能提供无与伦比的灵活性。对于那些寻求无麻烦解决方案的用户,**Novita AI 的 GPU 和 API 服务 ** 提供了一个完全优化的 DeepSeek R1 Turbo 版本,并采用 ** 按 token 计费 ** 的定价和 ** 免费试用 **。通过 DeepSeek R1 Turbo 体验下一代 AI 性能——立即从 Novita AI 开始!
常见问题
什么是 DeepSeek R1 Turbo?
DeepSeek R1 Turbo 是 DeepSeek R1 的优化版本,在 Novita AI 上提供 **3 倍吞吐量 、完全支持函数调用,以及 ** 限时 20% 折扣!
运行 DeepSeek R1 需要什么硬件?
**完整模型 **:需要企业级 GPU,如 H100 以获得最佳性能。
我可以免费试用 DeepSeek R1 吗?
是的,Novita AI 通过其 API 平台提供 免费试用。
Novita AI 是一个一体化云平台,助力您的 AI 雄心。集成 API、无服务器、GPU 实例——您需要的高性价比工具。消除基础设施,免费开始,让您的 AI 愿景成为现实。
