关键要点
卓越性能:在数学和编程基准测试中表现出色。
开源:可访问用于研究、修改和部署。
成本效益:性能与 OpenAI 的 o1 相当,但成本更低。
4 种免费方式:在线平台、本地运行、API、AI 游乐场
DeepSeek R1 是一款前沿的推理模型,旨在与 OpenAI 的 o1 相抗衡,在逻辑推理、数学和编程等复杂任务中表现出色。其开源特性和对高级推理能力的专注使其成为开发者和企业极具价值的工具。然而,与 DeepSeek V3 相比,R1 的定价更高。为了帮助您入门,以下是四种免费探索和使用 DeepSeek R1 的方法。
DeepSeek R1 概述
DeepSeek-R1 专为处理需要逻辑推理、高等数学和编程的任务而设计。它在 DeepSeek-R1-Zero 的基础上,结合强化学习和监督微调,以提高输出的清晰度和连贯性。DeepSeek-R1 在数学、代码和推理任务上达到了与 OpenAI-o1 相当的性能。

立即获取 20 美元积分,免费试用 DeepSeek R1!
主要特性
- 模型大小:671B 参数(每次推理激活 37B)
- 分词器:增强型分词器,带有自反思标签
- 支持语言:多语言,支持文化适应
- 多模态:仅文本
- 上下文窗口:128K tokens
- 存储格式:支持 Q8/Q5 量化
- 架构:混合专家模型(MoE)+ 强化学习增强训练流程
- 训练方法:基于 V3 基座,采用 RL 流程(SFT → RL → SFT → RL)
- 训练数据:V3 基座数据 + RL 优化数据
性能基准
DeepSeek-R1 在数学领域表现出色,在 MATH-500 上获得 97.3% 的顶级分数,在 AIME 2024 上获得 79.8% 的分数,超越竞争对手。在编程方面,它在 SWE-bench Verified 上获得 49.2%,在 Live Code Bench 上获得 65.9%,展示了其在两个领域的全面能力。

所有模型的最大生成长度设置为 32,768 tokens,使用特定的采样参数(temperature 0.6,top-p 0.95,每个查询 64 个响应)来计算 pass@1 基准分数。
DeepSeek-R1-Distill 模型
蒸馏,或知识蒸馏,是一种将知识从较大模型迁移到较小模型的机器学习方法。其目标是开发出一个更高效的模型,同时保持与较大模型相似的性能。
DeepSeek 还发布了 R1 的蒸馏版本,提供了更小的模型,这些模型保留了原始模型的大部分能力,同时计算效率更高。这些模型使用 DeepSeek-R1 生成的数据进行微调,参数大小从 15 亿到 700 亿不等。
- deepseek/deepseek-r1-distill-qwen-14b
- deepseek/deepseek-r1-distill-qwen-32b
- deepseek/deepseek-r1-distill-llama-70b
- deepseek/deepseek-r1-distill-llama-8b

1. 使用在线平台 访问 DeepSeek R1(例如 Novita AI)
您可以通过 Novita AI 平台访问 DeepSeek-R1,该平台提供了一种直观的方式与模型交互。要开始使用,只需进入聊天页面并注册即可。但请注意,在线平台不支持保存之前会话的聊天记录。
此外,Novita AI 还提供了一个参数调整面板,允许您自定义 max tokens、temperature 等设置,以满足特定需求。

2. 在本地运行 DeepSeek R1
1. 安装 Ollama
- 访问 Ollama 官网,下载并安装适用于您操作系统的版本。
2. 下载 DeepSeek-R1 模型
- 打开终端并运行(以 7B 参数版本为例):bashCopy
ollama run deepseek-r1:7b(等待下载完成,时间取决于网络速度。)
ollama run deepseek-r1:7b
3. 验证并运行
- 验证安装:
ollama list # 检查列表中是否出现 "deepseek-r1"
- 启动模型:
ollama run deepseek-r1:7b
4. 使用示例
- 提问:bashCopy
>>> "用简单的术语解释量子计算。" - 生成代码:bashCopy
>>> "编写一个 Python 函数来计算斐波那契数列。"
3. 访问免费 DeepSeek R1 API(例如 Novita AI)
Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 部署 AI 模型的便捷方式,同时还提供经济实惠且可靠的 GPU 云,用于构建和扩展应用。
步骤 1:登录并访问模型库
登录您的帐户,点击 模型库 按钮。

步骤 2:选择模型
浏览可用选项,选择适合您需求的模型。

步骤 3:开始免费试用
开始免费试用,探索所选模型的功能。

步骤 4:获取 API 密钥
为了通过 API 进行身份验证,我们将为您提供一个新的 API 密钥。进入“设置”页面,您可以复制 API 密钥,如下图所示。

步骤 5:安装 API
使用与您的编程语言对应的包管理器安装 API。

安装后,将必要的库导入到您的开发环境中。使用 API 密钥初始化 API,开始与 Novita AI LLM 交互。以下是适用于 Python 用户的聊天补全 API 示例。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
4. 在 Hugging Face 上实验 DeepSeek R1
步骤 1:配置 API 密钥
- 进入您的用户帐户设置管理 API 密钥。
- 将您的 Novita AI 自定义 API 密钥添加到 Hugging Face。

步骤 2:选择推理 API 模式
- 自定义密钥模式:调用直接发送到推理提供商,使用您自己的 API 密钥。
- HF 路由模式:此模式无需提供商令牌。费用将计入您的 Hugging Face 帐户,而非提供商帐户。

步骤 3:在模型页面上探索兼容的提供商
- 模型页面显示与所选模型兼容的第三方推理提供商(与当前模型兼容的提供商,按用户偏好排序)。

在 AI 游乐场中进行实验是探索 Llama 3 模型能力的绝佳方式,无需高级技术技能或设置。无论您是使用 HuggingChat 进行创意项目,使用 Meta AI Web 无缝集成到日常应用中,还是使用 Perplexity Labs 进行扩展实验,这些平台都能让各个级别的用户轻松访问和使用前沿 AI。
常见问题
DeepSeek R1 比 OpenAI 的 o1 更好吗?
DeepSeek R1 提供了相当的性能,尤其在推理任务中,而且它是开源的,成本效益更高。
哪些任务最适合 DeepSeek R1?
需要推理强度的任务,如数学求解、编程和行业特定应用。
DeepSeek-R1 能否针对特定任务或行业进行微调?
是的,DeepSeek-R1 可以针对特定任务进行微调,前提是您拥有必要的计算资源和数据。
Novita AI 是一个一体化云平台,助力您的 AI 雄心。集成 API、无服务器、GPU 实例 —— 经济高效的工具,您所需的一切。消除基础设施障碍,免费开始,将您的 AI 愿景变为现实。
