DeepSeek R2が登場間近ですが、すでにあるもので先んじるために待つ必要はありません。
誰もがDeepSeek R2を待ち望む中、賢い開発者はNovita AIでDeepSeekの現行の強力なモデルをすでに活用しています。
新規ユーザーは10ドルの無料クレジットを獲得でき、さらに友達を紹介すると最大500ドルのLLM API報酬を得られます。
現在のDeepSeekラインナップ:
- DeepSeek V3 0324: 入力0.33ドル / Mトークン、出力1.3ドル / Mトークン(128Kコンテキスト)
- DeepSeek R1 Turbo: 入力0.7ドル / Mトークン、出力2.5ドル / Mトークン(64Kコンテキスト)
- DeepSeek V3 Turbo: 入力0.4ドル / Mトークン、出力1.3ドル / Mトークン(64Kコンテキスト)
明日のモデルを待たずに、API呼び出しひとつで今日からゲームチェンジングなAIを展開しましょう。
DeepSeek V3、R1、V3 0324:共通のアーキテクチャ
| **カテゴリ ** | ** 詳細** |
|---|---|
| モデルサイズ | 671Bパラメータ(37Bアクティブ / トークン) |
| アーキテクチャ | Mixture of Experts(MoE) |
| オープンソース | はい(全バージョン) |
| 言語サポート | 多言語 — 英語と中国語に優れる |
| マルチモーダル | テキスト→テキストのみ |
| コンテキストウィンドウ | 128Kトークン |
| **バージョン ** | - DeepSeek R1:2025年1月21日 - DeepSeek V3 0324:2025年3月24日 - DeepSeek V3:2024年12月16日 |
DeepSeek V3、R1、0324 — 本当の違いはトレーニング

https://medium.com/@lixue421/deepseek-explained-8-post-training-of-deepseek-v3-6321d57f4fdf
それ以外にも、DeepSeek V3 0324はDeepSeek-R1で使用された強化学習手法からの知見を取り入れています。
DeepSeek V3、R1、0324:低価格と低レイテンシ
Novita AIは、3倍のスループット ** と期間限定60%割引 ** を提供するDeepSeek R1 Turbo を導入しました。さらに、このバージョンは 関数呼び出し を完全にサポートしています。
さらにエキサイティングなことに、Novita AIはOpenRouterでDeepSeek R1 APIのトップランクにランクインしています。
DeepSeek V3、R1、0324:GPTとのベンチマーク対決


DeepSeek-R1は複数の評価ベンチマークで優れたパフォーマンスを発揮し、特にHumanEval、MATH-500、MMLU-Proなどのタスクでトップクラスにランクインしています。
o1モデルもほとんどのタスクで良好なパフォーマンスを示し、一部のタスクではDeepSeek-R1と同等の結果を達成しています。
全体として、ほとんどの評価タスクにおいて、DeepSeek V3(2025年3月)はDeepSeek V3(2024年12月)を上回っています。唯一、LiveCodeBenchのコーディングタスクでは2024年12月版がわずかに優位です。
DeepSeek V3、R1、0324:高いハードウェア要件
| モデルバージョン | 必要なVRAM(概算) | GPU構成 | 合計GPUメモリ |
|---|---|---|---|
| DeepSeek V3 | 1423.01 GB | 24×H100(各80GB) | 1920 GB |
| DeepSeek V3 0324 | 1532 GB | 24×H100(各80GB) | 1920 GB |
| DeepSeek R1(ベース、671B) | 1854.43 GB | 24×H100(各80GB) | 1920 GB |
| DeepSeek-R1-Distill-Llama-8B | 22.2 GB | 1×RTX 4090(24GB) | 24 GB |
| DeepSeek-R1-Distill-Qwen-14B | 39 GB | 2×RTX 4090(各24GB) | 48 GB |
| DeepSeek-R1-Distill-Qwen-32B | 88.99 GB | 2×H100(各80GB) | 160 GB |
| DeepSeek-R1-Distill-Llama-70B | 194.14 GB | 4×H100(各80GB) | 320 GB |
DeepSeek V3、R1、0324:3つのAPIアクセスオプション
オプション1:直接API統合

主な機能:
- 統一エンドポイント:
/v3/openaiがOpenAIのChat Completions API形式をサポート。 - 柔軟な制御: temperature、top-p、ペナルティなどを調整して、結果をカスタマイズ可能。
- ストリーミングとバッチ処理: 好みの応答モードを選択可能。
オプション2:OpenAI Agents SDKによるマルチエージェントワークフロー
Novita AIとOpenAI Agents SDKを統合して、高度なマルチエージェントシステムを構築:
- プラグアンドプレイ: 任意のOpenAI AgentsワークフローでNovita AIのLLMを使用可能。
- ハンドオフ、ルーティング、ツール使用をサポート: エージェントがタスクを委任、トリアージ、または関数を実行できるように設計。すべてNovita AIのモデルを搭載。
- Python統合: SDKをNovitaのエンドポイント(
https://api.novita.ai/v3/openai)に向け、APIキーを使用するだけ。
サードパーティプラットフォームでQwen 3 APIに接続
- Hugging Face: Novita AIエンドポイントを介して、Spaces、パイプライン、またはTransformersライブラリでQwen 3を使用可能。

- エージェント&オーケストレーションフレームワーク: Continue、AnythingLLM、LangChain、Dify、Langflowなどのパートナープラットフォームと、公式コネクタおよびステップバイステップの統合ガイドを通じて簡単に接続。
- OpenAI互換API: ClineやCursorなど、OpenAI API標準向けに設計されたツールとシームレスに移行・統合可能。
DeepSeek V3、R1、0324 は同じ基盤モデルアーキテクチャを共有していますが、トレーニング手法によりパフォーマンスとアプリケーションに大きな違いが生じます。コスト、ハードウェア、タスク固有の品質のいずれを最適化する場合でも、これらのニュアンスを理解することで適切なモデルを選択できます。開発者にとって、Novita AIは主要なプラットフォーム間でシンプルかつ柔軟で手頃なアクセスを提供します。
よくある質問
全体的に最もパフォーマンスが良いDeepSeekモデルはどれですか?
DeepSeek V3(2025年3月)は、LiveCodeBenchで2024年12月版がわずかに優位な点を除き、平均的なベンチマークパフォーマンスが最も優れています。
すべてのバージョンが関数呼び出しをサポートしていますか?
はい — 特にNovita AI経由のR1 Turboは、OpenAI互換エンドポイントで完全サポートを提供しています。
ハードウェア要件は何ですか?
完全なモデルには24×H100 GPU(約1920 GB VRAM)が必要です。蒸留バージョンは単一のRTX 4090またはデュアルH100構成で実行可能です。
Novita AI は、開発者がシンプルなAPIを使用してAIモデルを簡単にデプロイできるAIクラウドプラットフォームであり、構築とスケーリングのための手頃で信頼性の高いGPUクラウドも提供しています。
