DeepSeek R2 即将到来——但何必等待?用已有的版本领先一步!
当众人都在期待 DeepSeek R2 时,聪明的开发者已经通过 Novita AI 上的 DeepSeek 当前强大模型占据先机。
新用户可获 $10 免费额度,推荐朋友还可赚取最高 $500 的 LLM API 奖励!
当前 DeepSeek 产品线:
- DeepSeek V3 0324: $0.33 / M 输入,$1.3 / M 输出(128K 上下文)
- DeepSeek R1 Turbo: $0.7 / M 输入,$2.5 / M 输出(64K 上下文)
- DeepSeek V3 Turbo: $0.4 / M 输入,$1.3 / M 输出(64K 上下文)
不要等待明天的模型——只需一个 API 调用,即可部署改变游戏规则的 AI。
DeepSeek V3、R1、V3 0324:相同架构
| **类别 ** | ** 详情** |
|---|---|
| 模型大小 | 671B 参数(每个 token 激活 37B) |
| 架构 | 混合专家(MoE) |
| 开源 | 是(所有版本) |
| 语言支持 | 多语言——擅长英语和中文 |
| 多模态 | 仅文本到文本 |
| 上下文窗口 | 128K tokens |
| **版本 ** | - DeepSeek R1:2025 年 1 月 21 日 - DeepSeek V3 0324:2025 年 3 月 24 日 - DeepSeek V3:2024 年 12 月 16 日 |
DeepSeek V3、R1、0324——真正区别在于训练

https://medium.com/@lixue421/deepseek-explained-8-post-training-of-deepseek-v3-6321d57f4fdf
此外,DeepSeek V3 0324 融合了 DeepSeek-R1 中使用的强化学习技术的洞见。
DeepSeek V3、R1、0324:低价与低延迟
Novita AI 推出了 DeepSeek R1 Turbo,提供 3 倍吞吐量 ** 和限时 60% 折扣 。此外,该版本完全支持 函数调用**。
更令人兴奋的是:Novita AI 在 OpenRouter 上的 DeepSeek R1 API 排名位居前列。
DeepSeek V3、R1 与 0324:与 GPT 的基准对决


DeepSeek-R1 在多个评估基准上表现优异,尤其是在 HumanEval、MATH-500 和 MMLU-Pro 等任务中名列前茅。
o1 模型在大多数任务中也表现良好,并在某些任务中达到与 DeepSeek-R1 相当的结果。
总体而言,在大多数评估任务中,DeepSeek V3(2025 年 3 月)优于 DeepSeek V3(2024 年 12 月)。仅在 LiveCodeBench 编码任务中,2024 年 12 月版本略占优势。
DeepSeek V3、R1 与 0324:高硬件需求
| 模型版本 | 大约所需 VRAM | GPU 配置 | 总 GPU 内存 |
|---|---|---|---|
| DeepSeek V3 | 1423.01 GB | 24×H100(每块 80GB) | 1920 GB |
| DeepSeek V3 0324 | 1532 GB | 24×H100(每块 80GB) | 1920 GB |
| DeepSeek R1(基础版,671B) | 1854.43 GB | 24×H100(每块 80GB) | 1920 GB |
| DeepSeek-R1-Distill-Llama-8B | 22.2 GB | 1×RTX 4090(24GB) | 24 GB |
| DeepSeek-R1-Distill-Qwen-14B | 39 GB | 2×RTX 4090(每块 24GB) | 48 GB |
| DeepSeek-R1-Distill-Qwen-32B | 88.99 GB | 2×H100(每块 80GB) | 160 GB |
| DeepSeek-R1-Distill-Llama-70B | 194.14 GB | 4×H100(每块 80GB) | 320 GB |
DeepSeek V3、R1 与 0324:3 种 API 接入方式
选项 1:直接 API 集成

主要特点:
- 统一端点:
/v3/openai支持 OpenAI 的 Chat Completions API 格式。 - 灵活控制: 调整 temperature、top-p、惩罚等参数,获得定制结果。
- 流式与批处理: 选择你偏好的响应模式。
选项 2:使用 OpenAI Agents SDK 构建多智能体工作流
通过将 Novita AI 与 OpenAI Agents SDK 集成,构建高级多智能体系统:
- 即插即用: 在任何 OpenAI Agents 工作流中使用 Novita AI 的 LLM。
- 支持交接、路由和工具使用: 设计能够委托、分类或运行函数的智能体,全部由 Novita AI 的模型驱动。
- Python 集成: 只需将 SDK 指向 Novita 的端点(
https://api.novita.ai/v3/openai)并使用你的 API 密钥。
在第三方平台上连接 Qwen 3 API
- Hugging Face: 通过 Novita AI 端点,在 Spaces、pipeline 或 Transformers 库中使用 Qwen 3。

- 智能体与编排框架: 通过官方连接器和逐步集成指南,轻松将 Novita AI 与合作伙伴平台(如 Continue、AnythingLLM、LangChain、Dify 和 Langflow)连接。
- 兼容 OpenAI 的 API: 享受与 Cline 和 Cursor 等工具的无缝迁移与集成,专为 OpenAI API 标准设计。
虽然 DeepSeek V3、R1 和 0324 共享相同的底层模型架构,但其训练方式导致性能和应用的显著差异。无论你是在优化成本、硬件还是特定任务质量,理解这些细微差别有助于你选择合适的模型。对于开发者而言,Novita AI 使访问变得简单、灵活且实惠,覆盖各大主流平台。
常见问题解答
哪个 DeepSeek 模型整体表现最好?
DeepSeek V3(2025 年 3 月)在平均基准性能上表现最佳,但在 LiveCodeBench 中,2024 年 12 月版本略占优势。
所有版本都支持函数调用吗?
是的——尤其是通过 Novita AI 提供的 R1 Turbo,通过兼容 OpenAI 的端点提供全面支持。
硬件要求是什么?
完整模型需要 24×H100 GPU(约 1920 GB VRAM);蒸馏版本可在单块 RTX 4090 或双 H100 上运行。
Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 部署 AI 模型的便捷方式,同时提供经济实惠且可靠的 GPU 云用于构建和扩展。
