主なハイライト
1. 高度なパフォーマンス
優れた推論力: 数学(AIME 2024、MATH-500)およびコーディング(Codeforces)ベンチマークで優位。
アーキテクチャ: MoE + RL 強化トレーニング、671Bパラメータ(トークンあたり37Bアクティブ)。
2. Ollama によるローカルアクセス
Ollamaをインストール; ollama run deepseek-r1:7b を実行してダウンロード; ollama list で確認し、ターミナルから操作。
3. ローカルデプロイの課題
ハードウェア: 24GB以上のVRAMを備えた高性能GPU(例:H800)が必要。
メモリ: 671Bパラメータの読み込みが遅く、ディスクスワップのリスクあり。
セットアップ: 重み、ライブラリ、設定を手動でインストール。
蒸留モデル: 小規模版(例:Qwen-32B)はリソースを減らすが、パフォーマンスを犠牲にする。
**4. APIアクセス **: Novita AI は DeepSeek R1 のAPIを提供。無料トライアルにサインアップして、シンプルなリクエストでAPIを使用できます。
DeepSeek R1は、特に数学とコーディングにおいて強力な推論能力で知られる最先端のAIモデルです。この記事では、DeepSeek R1にローカルでアクセスする方法とAPIを介してアクセスする方法を解説します。
DeepSeek R1とは?
- リリース日: 2025年1月21日
- モデル規模:
- 主な特徴:
- モデルサイズ: 671Bパラメータ(トークンあたり37Bアクティブ)
- トークナイザー: 自己内省タグを備えた拡張トークナイザー
- 対応言語: 多言語、文化的適応対応
- マルチモーダル: テキストのみ
- コンテキストウィンドウ: 128Kトークン
- ストレージ形式: Q8/Q5量子化対応
- アーキテクチャ: Mixture of Experts (MoE) + RL強化トレーニングパイプライン
- トレーニング方法: V3ベースにRLパイプライン(SFT → RL → SFT → RL)を適用
- トレーニングデータ: V3ベース + RL最適化データ
https://www.youtube.com/watch?v=ApvcIYDgXzg
ベンチマーク比較

DeepSeek-R1は、ほとんどのテスト、特に高い精度と複雑な推論が要求されるタスク(AIME 2024、Codeforces、MATH-500、MMLUなど)で優れた性能を示します。これらの分野ではOpenAI-o1-1217やOpenAI-o1-miniを上回ります。ただし、DeepSeek-R1はGPQA DiamondやSWE-bench Verifiedといった特定のタスクでは弱いパフォーマンスを示しており、Open AI O1などのモデルと比較して改善の余地があることを示しています。
用途
- 数学的問題解決とコード生成。
- 複雑な論理的推論タスク。
- 複雑な問題の診断支援。
- マルチステップシナリオの分析。
- 大規模データセットからの洞察の統合。
- カスタマーサービスアプリケーション。
DeepSeek R1にローカルでアクセスする方法
https://www.youtube.com/watch?v=pbCQnDDj-bo
ステップバイステップのインストールガイド
1. Ollamaのインストール
- Ollamaウェブサイトにアクセスし、お使いのOS用のバージョンをダウンロードしてインストールします。
2. DeepSeek-R1モデルのダウンロード
- ターミナルを開き、次を実行します(7Bパラメータ版の例): bashCopy
ollama run deepseek-r1:7b(ダウンロードが完了するまで待ちます。時間はネットワーク速度に依存します。)
ollama run deepseek-r1:7b
3. 確認と実行
- インストールの確認:
ollama list # リストに "deepseek-r1" が表示されるか確認
- モデルの起動:
ollama run deepseek-r1:7b
4. 使用例
- クエリの実行: bashCopy
>>> "量子コンピューティングを簡単な言葉で説明してください。" - コードの生成: bashCopy
>>> "フィボナッチ数列を計算するPython関数を書いてください。"
ローカルデプロイの課題
1. ハードウェアの制限
- 高いリソース需要:
- 大容量VRAM/RAMを備えたハイエンドGPU/TPU(例:H800)が必要。
- メモリ制約:
- 671Bパラメータ(トークンあたり37Bアクティブ)により読み込みが遅い。
- VRAM/RAMが不十分だと、ディスクスワップや障害が発生。
2. セットアップと設定
- 複雑なインストール:
- 手動でモデルの重み(Hugging Face)のダウンロード、ライブラリ(例:
transformers)のインストール、フレームワークの設定が必要。 - 最適化には技術的な専門知識が必要。
- 手動でモデルの重み(Hugging Face)のダウンロード、ライブラリ(例:
- ソフトウェアの最適化:
- 適切な推論パターンを確保するため、応答を
thinking\で開始させる必要がある。
- 適切な推論パターンを確保するため、応答を
3. パフォーマンスのボトルネック
- 推論の低速化:
- CPU/GPUの制限やメモリ帯域幅により処理速度が低下。
- メンテナンスのオーバーヘッド:
- 新しいモデルバージョンへの手動アップデートが継続的な負担。
4. 蒸留モデルとのトレードオフ
- リソース要件の低減:
- 小規模版(例:Qwen-32B、Llama-70B)はハードウェア要件を低減。
- 例:Qwen-32BはベンチマークでOpenAI-o1-miniを上回る。
- パフォーマンスの欠点:
- 完全な671Bモデルと比較して精度や能力を犠牲にする。
- 深い推論が必要な複雑なタスクでは苦戦する可能性。
完全な機能が必要な場合: ハードウェアやセットアップの問題を避けるため、APIアクセスを選択してください。
Novita AI経由でDeepSeek R1にアクセスする方法
Novita AIは、開発者がシンプルなAPIを使用してAIモデルを簡単にデプロイできるAIクラウドプラットフォームであり、手頃な価格で信頼性の高いGPUクラウドも提供しています。
ステップ1: ログインしてモデルライブラリにアクセス
アカウントにログインし、Model Library ボタンをクリックします。

ステップ2: モデルを選択
利用可能なオプションを参照し、ニーズに合ったモデルを選択します。

ステップ3: 無料トライアルを開始
無料トライアルを開始して、選択したモデルの機能を試します。

ステップ4: APIキーを取得
APIで認証するために、新しいAPIキーが提供されます。「Settings」ページに入り、画像のようにAPIキーをコピーできます。

ステップ5: APIをインストール
使用するプログラミング言語に対応したパッケージマネージャを使用してAPIをインストールします。

インストール後、必要なライブラリを開発環境にインポートします。APIキーを使用してAPIを初期化し、Novita AI LLMとの対話を開始します。これはPythonユーザー向けのチャット完了APIの使用例です。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
登録時に、Novita AIは$0.5クレジットを提供してスタートをサポートします!
無料クレジットを使い切った場合も、支払いにより継続して利用できます。
どの方法があなたに適していますか?
- 研究者: 一般的には、実験の柔軟性と制御のためにローカルアクセスが好まれます。
- 開発者:
- APIアクセスはアプリケーション構築や迅速なプロトタイピングに適しています。
- ローカルアクセスは微調整やカスタムワークフローに適しています。
- 企業: APIアクセスは、高い初期費用なしでサービスに迅速に統合できるため有益です。ローカルデプロイは、一貫した要件があり、インフラに投資できるチームに適しています。
- 小規模チーム/個人: APIアクセスは、初期費用が低いため一般的に現実的です。
- 技術スキルが限られているユーザー: 深い技術知識が不要なため、APIアクセスが推奨されます。
まとめると、DeepSeek R1は最先端の推論能力を持つ印象的なモデルです。ローカルで実行するかAPIを使用するかの選択では、制御、コスト、利便性のトレードオフを考慮する必要があります。これらの要素とこの記事の具体的な推奨事項を慎重に検討することで、目標に最適なアクセス方法を選択できます。
よくある質問
DeepSeek R1はOpenAIのo1より優れていますか?
DeepSeek R1は、特に推論タスクにおいて同等のパフォーマンスを提供し、さらにオープンソースでより費用対効果が高いという利点があります。
DeepSeek R1を微調整するにはどうすればよいですか?
オープンソースモデルとして、DeepSeek R1は特定のタスク向けに微調整が可能ですが、そのためには計算リソースとデータが必要です。
モデルはどのようにトレーニングされますか?
DeepSeek R1はOpenAIのo1モデルよりも大幅に安価です。
Novita AI は、AIの野心を実現するオールインワンのクラウドプラットフォームです。統合API、サーバーレス、GPUインスタンス — 必要なコスト効率の高いツール。インフラを排除し、無料で始めて、AIビジョンを現実にしましょう。
