主なハイライト
Novita AIは、3倍のスループット ** と期間限定60%割引 ** を実現した DeepSeek R1 Turbo を発表しました。さらに、このバージョンは ** 関数呼び出し(function calling)** を完全にサポートしています。
Novita AI で無料トライアルを開始できます!

さらに嬉しいニュース:Novita AIがOpenRouterでDeepSeek R1 APIのランキング1位を獲得しました。

DeepSeek R1とは?
- リリース日:2025年1月21日
- モデル規模:
- 主な特徴:
- モデルサイズ:671Bパラメータ(アクティブ37B/トークン)
- トークナイザー:自己反省タグを備えた拡張トークナイザー
- 対応言語:多言語対応(文化的適応機能付き)
- マルチモーダル:テキストのみ
- コンテキストウィンドウ:128Kトークン
- ストレージ形式:Q8/Q5量子化対応
- アーキテクチャ:Mixture of Experts (MoE) + RL強化トレーニングパイプライン
- トレーニング手法:V3ベースにRLパイプライン(SFT → RL → SFT → RL)を適用
- トレーニングデータ:V3ベース + RL最適化データ

ベンチマーク

DeepSeek-R1は、ほとんどのタスクで顕著なパフォーマンス向上を示し、特にCodeforcesとGPQA Diamondタスクではそれぞれ9.0%と5.7%の向上を達成し、複雑なタスク処理における強力な能力を示しています。
DeepSeek R1のハードウェア要件
| モデル | 精度 | GPU | 台数 |
|---|---|---|---|
| DeepSeek-R1-Distill-Qwen-1.5B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-7B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Llama-8B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-14B | BF16 | RTX 4090 | 2 |
| DeepSeek-R1-Distill-Qwen-32B | BF16 | RTX 4090 | 4 |
| DeepSeek-R1-Distill-Llama-70B | BF16 | RTX 4090 | 8 |
| DeepSeek-R1 (671B) | BF16 | H100 | 8 |
DeepSeek-R1 のハードウェア要件は明確に階層化されています:
- 蒸留モデル はハードウェア要件が比較的低く、特に小~中規模のモデルはハイエンドコンシューマー向けハードウェア(例:RTX 4090)に適しています。
- フルスケールモデル はハードウェア要件が非常に高く、特に超大規模モデルはプロフェッショナルグレードのハードウェア(例:H100 GPU)に依存します。
- 全体として、蒸留技術はハードウェア要件を大幅に低減し、モデルデプロイの柔軟性を高めますが、フルスケールモデルはピーク性能を達成するために依然として非常に高性能なハードウェアを必要とします。
GPUの購入やセルフデプロイが複雑すぎると感じる場合は、**Novita AIのGPUおよびAPIサービス ** をご利用ください。完全最適化済みの DeepSeek-R1 を提供しており、非常に便利で、トークン数に基づいて課金されます。
クラウドGPUサービスにNovita AIを選ぶ理由
Novita AIはAIクラウドプラットフォームです。開発者はシンプルなAPIを使用してAIモデルを簡単にデプロイできるほか、手頃で信頼性の高いGPUクラウドを利用してアプリケーションの構築とスケーリングが可能です。
ステップ1:アカウント登録
Novita AIを初めてご利用になる方は、まず当社ウェブサイトでアカウントを作成してください。登録後、「GPUs」タブに移動して利用可能なリソースを確認し、旅を始めましょう。

ステップ2:テンプレートとGPUサーバーの探索
まず、プロジェクトのニーズに合ったテンプレート(PyTorch、TensorFlow、CUDAなど)を選択します。要件に合ったバージョン(例:PyTorch 2.2.1やCUDA 11.8.0)を選んでください。次に、A100 GPUサーバー構成を選択します。これは、大量のVRAM、RAM、ディスク容量を備え、負荷の高いワークロードを処理する強力なパフォーマンスを提供します。

ステップ3:デプロイのカスタマイズ
テンプレートとGPUを選択したら、オペレーティングシステムのバージョン(例:CUDA 11.8)などのパラメータを調整してデプロイ設定をカスタマイズします。その他の設定もプロジェクト固有の要件に合わせて調整できます。

ステップ4:インスタンスの起動
テンプレートとデプロイ設定を確定したら、「Launch Instance」をクリックしてGPUインスタンスをセットアップします。これにより環境のセットアップが開始され、AIタスクにGPUリソースを使用できるようになります。

APIサービスにNovita AIを選ぶ理由
Novita AIはAIクラウドプラットフォームです。開発者はシンプルなAPIを使用してAIモデルを簡単にデプロイできるほか、手頃で信頼性の高いGPUクラウドを利用してアプリケーションの構築とスケーリングが可能です。
ステップ1:ログインしてモデルライブラリにアクセス
アカウントにログインし、モデルライブラリ ボタンをクリックします。

ステップ2:モデルを選択
利用可能なオプションからニーズに合ったモデルを選択します。

ステップ3:無料トライアルを開始
選択したモデルの機能を探索するために、無料トライアルを開始します。

ステップ4:APIキーを取得
APIで認証するために、新しいAPIキーを提供します。「設定」ページに移動し、画像のようにAPIキーをコピーします。

ステップ5:APIのインストール
使用するプログラミング言語に対応したパッケージマネージャーを使用してAPIをインストールします。

インストール後、開発環境に必要なライブラリをインポートします。APIキーを使ってAPIを初期化し、Novita AI LLMとの対話を開始します。以下はPythonユーザー向けのチャット補完APIの使用例です。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Novita AIは DeepSeek R1 Turbo でAIデプロイに革命をもたらし、**3倍のスループット ** と **関数呼び出し ** などの高度な機能をサポートし、現在 ** 期間限定20%割引 ** を提供しています。RTX 4090 などのコンシューマー向けGPUで蒸留モデルを実行する場合でも、エンタープライズグレードの H100 GPU でフルスケールモデルをデプロイする場合でも、Novita AIは比類のない柔軟性を提供します。手間のかからないソリューションをお求めの方は、Novita AIのGPUおよびAPIサービス ** で完全最適化された DeepSeek R1 Turbo を、 トークンベースの料金 ** と ** 無料トライアル ** とともにお試しください。DeepSeek R1 Turbo で次世代のAIパフォーマンスを体験してください。今すぐ Novita AI をお始めください!
よくある質問
DeepSeek R1 Turboとは何ですか?
DeepSeek R1 TurboはDeepSeek R1の最適化バージョンで、3倍のスループット 、関数呼び出しの完全サポート、およびNovita AIでの 期間限定20%割引を提供します!
DeepSeek R1を実行するにはどのようなハードウェアが必要ですか?
**フルスケールモデル **:最適なパフォーマンスを得るには、H100 などのエンタープライズグレードのGPUが必要です。
DeepSeek R1を無料で試すことはできますか?
はい。Novita AI はAPIプラットフォームを通じて DeepSeek R1の無料トライアル を提供しています。
Novita AI は、AIの野望を実現するオールインワンのクラウドプラットフォームです。統合API、サーバーレス、GPUインスタンス – 必要なコスト効率の高いツールを提供します。インフラストラクチャを排除し、無料で始めて、AIビジョンを現実にしましょう。
