R2 到来前解锁 DeepSeek 的 3 个 API 技巧

DeepSeek R2 即将到来——但何必等待？用已有的版本领先一步！

当众人都在期待 DeepSeek R2 时，聪明的开发者已经通过 Novita AI 上的 DeepSeek 当前强大模型占据先机。

新用户可获 $10 免费额度，推荐朋友还可赚取最高 $500 的 LLM API 奖励！

当前 DeepSeek 产品线：

不要等待明天的模型——只需一个 API 调用，即可部署改变游戏规则的 AI。

DeepSeek V3、R1、V3 0324：相同架构

类别	详情
模型大小	671B 参数（每个 token 激活 37B）
架构	混合专家（MoE）
开源	是（所有版本）
语言支持	多语言——擅长英语和中文
多模态	仅文本到文本
上下文窗口	128K tokens
版本	- DeepSeek R1：2025 年 1 月 21 日 - DeepSeek V3 0324：2025 年 3 月 24 日 - DeepSeek V3：2024 年 12 月 16 日

此外，DeepSeek V3 0324 融合了 DeepSeek-R1 中使用的强化学习技术的洞见。

Novita AI 推出了 DeepSeek R1 Turbo，提供 3 倍吞吐量 ** 和限时 60% 折扣 。此外，该版本完全支持 函数调用**。

更令人兴奋的是：Novita AI 在 OpenRouter 上的 DeepSeek R1 API 排名位居前列。

DeepSeek-R1 在多个评估基准上表现优异，尤其是在 HumanEval、MATH-500 和 MMLU-Pro 等任务中名列前茅。

o1 模型在大多数任务中也表现良好，并在某些任务中达到与 DeepSeek-R1 相当的结果。

总体而言，在大多数评估任务中，DeepSeek V3（2025 年 3 月）优于 DeepSeek V3（2024 年 12 月）。仅在 LiveCodeBench 编码任务中，2024 年 12 月版本略占优势。

模型版本	大约所需 VRAM	GPU 配置	总 GPU 内存
DeepSeek V3	1423.01 GB	24×H100（每块 80GB）	1920 GB
DeepSeek V3 0324	1532 GB	24×H100（每块 80GB）	1920 GB
DeepSeek R1（基础版，671B）	1854.43 GB	24×H100（每块 80GB）	1920 GB
DeepSeek-R1-Distill-Llama-8B	22.2 GB	1×RTX 4090（24GB）	24 GB
DeepSeek-R1-Distill-Qwen-14B	39 GB	2×RTX 4090（每块 24GB）	48 GB
DeepSeek-R1-Distill-Qwen-32B	88.99 GB	2×H100（每块 80GB）	160 GB
DeepSeek-R1-Distill-Llama-70B	194.14 GB	4×H100（每块 80GB）	320 GB

主要特点：

通过将 Novita AI 与 OpenAI Agents SDK 集成，构建高级多智能体系统：

即插即用： 在任何 OpenAI Agents 工作流中使用 Novita AI 的 LLM。
支持交接、路由和工具使用： 设计能够委托、分类或运行函数的智能体，全部由 Novita AI 的模型驱动。
Python 集成： 只需将 SDK 指向 Novita 的端点（https://api.novita.ai/v3/openai）并使用你的 API 密钥。

智能体与编排框架： 通过官方连接器和逐步集成指南，轻松将 Novita AI 与合作伙伴平台（如 Continue、AnythingLLM、LangChain、Dify 和 Langflow）连接。
兼容 OpenAI 的 API： 享受与 Cline 和 Cursor 等工具的无缝迁移与集成，专为 OpenAI API 标准设计。

虽然 DeepSeek V3、R1 和 0324 共享相同的底层模型架构，但其训练方式导致性能和应用的显著差异。无论你是在优化成本、硬件还是特定任务质量，理解这些细微差别有助于你选择合适的模型。对于开发者而言，Novita AI 使访问变得简单、灵活且实惠，覆盖各大主流平台。

哪个 DeepSeek 模型整体表现最好？

DeepSeek V3（2025 年 3 月）在平均基准性能上表现最佳，但在 LiveCodeBench 中，2024 年 12 月版本略占优势。

所有版本都支持函数调用吗？

是的——尤其是通过 Novita AI 提供的 R1 Turbo，通过兼容 OpenAI 的端点提供全面支持。

硬件要求是什么？

完整模型需要 24×H100 GPU（约 1920 GB VRAM）；蒸馏版本可在单块 RTX 4090 或双 H100 上运行。

Novita AI 是一个 AI 云平台，为开发者提供通过简单 API 部署 AI 模型的便捷方式，同时提供经济实惠且可靠的 GPU 云用于构建和扩展。