オープンソースイノベーションの世界は、DeepSeek V3のリリースにより大きな飛躍を遂げています。DeepSeek V3は、プログラミングタスクへの開発者のアプローチを再定義する高度なコード生成モデルです。現在Novita AIで利用可能なこの画期的なモデルは、開発者、研究者、テクノロジー愛好家に比類ない能力を提供します。
DeepSeek V3とは?
DeepSeek V3は、6710億のパラメータを持つ最先端のMixture-of-Experts(MoE)大規模言語モデルであり、推論時にトークンあたり370億パラメータが活性化されます。オープンソースモデルとしてリリースされ、コーディング、推論、数学、テキスト生成における複雑な課題に取り組むことができます。
DeepSeek V3は、効率的なアーキテクチャとコスト効率の良いトレーニングで際立っています。トレーニングにはわずか278万8000 H800 GPU時間を要し、約550万ドルのコストで済み、GPT-4のような同等のクローズドソースモデルに必要なリソースを大幅に下回ります。Multi-Head Latent Attention(MLA)やMulti-Token Prediction(MTP)などの革新的な技術を採用することで、DeepSeek V3は優れたパフォーマンスを発揮し、スケーラブルでアクセスしやすいものとなっています。
DeepSeek V3の主な特徴
1. Mixture-of-Experts(MoE)アーキテクチャ
DeepSeek V3は、きめ細かい動的負荷分散技術を備えたMoEフレームワークを採用しています。従来のMoEモデルとは異なり、補助損失を必要とせず、パフォーマンスを低下させることなく計算リソースが効率的に分散されます。
2. Multi-Head Latent Attention(MLA)
MLAは、アテンションキーと値を圧縮することで推論効率を向上させ、メモリオーバーヘッドを削減しながら高品質なアテンションを維持します。これにより、DeepSeek V3は最大128Kトークンの長いコンテキストウィンドウを処理でき、長いテキスト入力を伴うタスクに最適です。
3. Multi-Token Prediction(MTP)
MTP目標により、DeepSeek V3は複数のトークンを同時に予測でき、トレーニング効率と推論速度の両方を向上させます。この機能は、長文コンテンツの生成や複雑な問題の解決に特に役立ちます。
4. FP8混合精度トレーニング
DeepSeek V3はトレーニングにFP8(8ビット浮動小数点)精度を使用し、数値的安定性を維持しながらメモリと計算コストを削減します。この革新により、大規模なハードウェアフットプリントを必要とせずに、モデルを効率的にスケールできます。
5. 英語と中国語の言語サポート
DeepSeek V3は英語と中国語に最適化されており、これら2つの広く使用されている言語で多言語アプリケーションを構築する開発者にとって優れた選択肢です。幅広い言語をサポートしているわけではありませんが、これらの特定のドメインで優れた性能を発揮します。
DeepSeek V3のベンチマークパフォーマンス
DeepSeek V3は、さまざまなベンチマークにおいて、多くのオープンソースモデルやクローズドソースモデルでさえも一貫して上回ります。以下にそのパフォーマンスの比較を示します。

- コーディングの優秀性:
- DeepSeek V3は、HumanEval-Mul (Pass@1) で82.6%、Codeforces で51.6% を達成し、コード生成および評価タスクの堅牢なソリューションです。
- LiveCodeBench (Pass@1-COT) では、40.5% と前任モデルを大幅に上回り、他のモデルと競争力のあるパフォーマンスを示しています。
- 数学的推論:
- DeepSeek V3は MATH-500 (90.2%) でリードし、CNMO 2024 (Pass@1) および AIME 2024 でも強力なパフォーマンスを示し、高度な数学的問題解決を処理できる能力を実証しています。
- 多言語能力:
- CLUEWSC で90.9%、C-Eval で86.5% を達成し、DeepSeek V3は中国語固有のタスクに優れたモデルとしての地位を固め、英語ベンチマーク(MMLU (88.5%))でも堅牢なパフォーマンスを維持しています。
- 一般的な知識と推論:
- DROP (3-shot F1) で91.6%、MMLU-Redux で89.1% を達成し、知識集約型アプリケーションでの有用性を示しています。
DeepSeek V3のデプロイオプション
DeepSeek V3は柔軟なデプロイを提供し、ユーザーはワークフローにシームレスに統合できます。ローカルで実行するかクラウド上で実行するかにかかわらず、このモデルはさまざまなハードウェアとオープンソースコミュニティのソフトウェアツールをサポートしています。以下は、デプロイにおすすめのオプションです。
- DeepSeek-Inferデモ: FP8およびBF16推論用のシンプルで軽量なデモで、モデルを簡単にテストできます。
- SGLang: BF16およびFP8の両方の推論モードでDeepSeek-V3モデルを完全サポート。近日中にMulti-Token Prediction(MTP)サポートが追加される予定です。
- LMDeploy: ローカルおよびクラウドデプロイの両方で効率的なFP8およびBF16推論を可能にします。
- TensorRT-LLM: 現在BF16推論とINT4/INT8量子化をサポート。FP8サポートは将来のアップデートで計画されています。
- vLLM: DeepSeek V3をFP8およびBF16モードでサポートし、テンソル並列処理とパイプラインレベル並列処理による効率的なスケーリングを実現します。
Novita AIでDeepSeek V3 APIにアクセスする
Novita AIのプラットフォームは、事前設定されたAPIと手頃な価格のGPUクラウドインフラストラクチャを提供することで、DeepSeek V3のデプロイを簡素化します。開発者は、ハードウェアのセットアップやスケーラビリティを気にすることなく、モデルをアプリケーションにシームレスに統合できます。
Novita AIでDeepSeek V3を使い始めるには、次の手順に従ってください。
ステップ1: Novita AI にアクセスし、Google、GitHubアカウント、またはメールアドレスでログインします。
ステップ2: DeepSeek V3デモ を試します。

ステップ3: Novita AI上のモデルの LLMメトリクスコンソール を監視します。
ステップ4: APIキーを取得します。
- 設定内の「Key Management」に移動します。
- 初回ログイン時にデフォルトキーが作成されます。
- 「+ Add New Key」をクリックして追加のキーを生成します。
ステップ5: 開発環境をセットアップし、コンテンツ、ロール、名前、プロンプトなどのオプションを設定します。
API統合
Novita AIはCurl、Python、JavaScript用のクライアントライブラリを提供しており、DeepSeek-R1 Instructをプロジェクトに簡単に統合できます。
Pythonユーザー向け:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek_v3"
stream = True # or False
max_tokens = 8192
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
JavaScriptユーザー向け:
import OpenAI from "openai";
const openai = new OpenAI({
baseURL: "https://api.novita.ai/v3/openai",
apiKey: "<YOUR Novita AI API Key>",
});
const stream = true; // or false
async function run() {
const completion = await openai.chat.completions.create({
messages: [
{
role: "system",
content: "Be a helpful assistant",
},
{
role: "user",
content: "Hi there!",
},
],
model: "deepseek/deepseek_v3",
stream,
response_format: { type: "text" },
max_tokens: 8192,
temperature: 1,
top_p: 1,
min_p: 0,
top_k: 50,
presence_penalty: 0,
frequency_penalty: 0,
repetition_penalty: 1
});
if (stream) {
for await (const chunk of completion) {
if (chunk.choices[0].finish_reason) {
console.log(chunk.choices[0].finish_reason);
} else {
console.log(chunk.choices[0].delta.content);
}
}
} else {
console.log(JSON.stringify(completion));
}
}
run();
Curlユーザー向け:
curl "https://api.novita.ai/v3/openai/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer <YOUR Novita AI API Key>" \
-d @- << 'EOF'
{
"model": "deepseek/deepseek_v3",
"messages": [
{
"role": "system",
"content": "Be a helpful assistant"
},
{
"role": "user",
"content": "Hi there!"
}
],
"response_format": { "type": "text" },
"max_tokens": 8192,
"temperature": 1,
"top_p": 1,
"min_p": 0,
"top_k": 50,
"presence_penalty": 0,
"frequency_penalty": 0,
"repetition_penalty": 1
}
EOF
今すぐDeepSeek V3のパワーを解放しましょう
DeepSeek V3は、スケーラビリティ、コスト効率、優れたパフォーマンスを組み合わせた、オープンソースAIにおける画期的な成果です。GPUやクラウドプラットフォームにわたる多様なデプロイオプションにより、DeepSeek V3は開発者や企業にとって強力なツールとなります。
今すぐNovita AIでDeepSeek V3を始めて、高度なAIの可能性をプロジェクトに活用しましょう。
Novita AIについて
Novita AIは、開発者がシンプルなAPIを使用してAIモデルを簡単にデプロイできるAIクラウドプラットフォームであると同時に、手頃な価格で信頼性の高いGPUクラウドを提供し、構築とスケーリングを支援します。
