主なハイライト
DeepSeek V3 0324は、論理的思考、数学的問題解決、関数呼び出しの精度、専門的な言語能力において大幅な強化をもたらします。
Novita AIで無料トライアルを開始できます!
主なハイライトは、拡張された128,000トークンのコンテキストウィンドウで、長文の理解が向上します。 価格は非常に競争力があり、入力トークン100万あたり0.39ドル、出力トークン100万あたり1.3ドルです。
DeepSeekは、DeepSeek-V3-0324のリリースにより、人工知能の基準を再び引き上げました。このオープンソースの言語モデルは、前世代を大幅に上回る性能を発揮し、GPT-4.5やClaude 3.7 Sonnetなどの最高の競合モデルを難なく凌駕します。
DeepSeek V3 0324とは?
Deepseek V3 0324の概要
| 基本情報 | リリース日 | 2025年3月24日 |
| モデルサイズ | 671Bパラメータ(トークンあたり37Bアクティブ) | |
| オープンソース | オープン | |
| アーキテクチャ | Mixture-of-Experts (MoE) | |
| 機能 | 関数呼び出しをサポート | |
| 言語サポート | 対応多言語 | 中国語の機能強化 |
| マルチモーダル | マルチモーダル機能 | Text to text |
| トレーニング | トレーニングデータ | 14.8兆トークンの多様なデータ |
| 精度別モデルサイズ | テンソルタイプ | BF16/F8_E4M3/F32 |

Deepseek V3 0324の主なハイライト
フロントエンドWeb開発
- コードの実行性の向上:
- セマンティックHTMLの使用、コードのクリーン化、バージョン管理の使用など、ベストプラクティスに従って読みやすさと保守性を確保します。
- より美しいWebページとゲームフロントエンド:
- レスポンシブデザインとCSSフレームワーク(例:Sass、Bootstrap)を使用して、さまざまなデバイスでの視覚的な魅力とレイアウトを向上させます。
中国語ライティング能力
- スタイルとコンテンツ品質の向上:
- 蘭亭序に見られる優雅な文体を研究・模倣し、文章の流暢さと優雅さを向上させます。
- 中長文ライティングの品質向上:
- 「起承転結」のような構成を使用して、文章に明確で論理的な流れを持たせます。
機能強化
- マルチターン対話型リライトの改善:
- 自然言語処理を用いてマルチターン対話をサポートし、対話性を高めるツールを開発します。
- 翻訳品質と手紙作成の最適化:
- DeepSeekのような機械学習モデルを使用して翻訳精度を向上させ、手紙の文体提案を提供します。
Novita AIは DeepSeek V3 0324 を導入しました。128,000のコンテキストと魅力的な価格(入力トークン100万あたり0.39ドル、出力トークン100万あたり1.3ドル)を提供しています。
さらに、このバージョンは 関数呼び出し を完全にサポートしています。
Novita AIで無料トライアルを開始できます!
DeepSeek V3 0324をローカルで使用する
必要なハードウェア
| モデル | モデルVRAM | 必要なGPU | GPU必要数 |
| Deepseek V3 0324 | ~1532 GB | 24Xh100(80*24GB) | 1920GB |
| 4ビットモデル | ~386 GB | 8Xh100(80*24GB) | 640GB |
または他のビット方式を利用できます:

出典: unsloth
ステップバイステップガイド
ステップ1: llama.cppを入手してビルドする
1.リポジトリをクローンして依存関係をインストールする:
<code>sudo apt-get update sudo apt-get install -y pciutils build-essential cmake curl libcurl4-openssl-dev git clone https://github.com/ggml-org/llama.cpp</code>
2.llama.cppをビルドする:
<code>make llama.cpp -B llama.cpp/build \ -DBUILD_SHARED_LIBS=OFF -DGGML_CUDA=ON -DLLAMA_CURL=ON</code>
3.バイナリをコンパイルする:
<code>cmake --build llama.cpp/build --config Release -j --clean-first --target llama-quantize llama-cli llama-gguf-split cp llama.cpp/build/bin/llama-* llama.cpp</code>
ステップ2: モデルをダウンロードする
1.必要なPythonライブラリをインストールする:
<code>pip install huggingface_hub hf_transfer</code>
2.DeepSeek-V3-0324 GGUFモデルをダウンロードする:
import os
from huggingface_hub import snapshot_download
os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
snapshot_download(
repo_id="unsloth/DeepSeek-V3-0324-GGUF",
local_dir="unsloth/DeepSeek-V3-0324-GGUF",
allow_patterns=["*UD-Q2_K_XL*"] # Dynamic 2.7-bit (230GB)
)
ステップ3: モデルを実行する
ハードウェアに基づいてパラメータを調整します:
--threads: CPUスレッド数(例:ハイコアCPUの場合は32)
--ctx-size: コンテキスト長(例:大容量メモリの場合は16384)
--n-gpu-layers: GPUにオフロードされるレイヤー数。パフォーマンス向上のために増やしますが、GPUメモリが不足する場合は減らします。CPUのみの推論では省略します。
API経由でDeepSeek V3 0324を使用する
Novita AIはAIクラウドプラットフォームで、シンプルなAPIを使用してAIモデルを簡単にデプロイできるだけでなく、構築とスケーリングのための手頃で信頼性の高いGPUクラウドを提供します。
ステップ1: ログインしてモデルライブラリにアクセスする
アカウントにログインし、モデルライブラリ ボタンをクリックします。

ステップ2: モデルを選択する
利用可能なオプションを参照し、ニーズに合ったモデルを選択します。

ステップ3: 無料トライアルを開始する
選択したモデルの機能を探索するために無料トライアルを開始します。

ステップ4: APIキーを取得する
API認証のために、新しいAPIキーを提供します。「設定」ページに入り、画像のようにAPIキーをコピーできます。

ステップ5: APIをインストールする
使用するプログラミング言語に応じたパッケージマネージャーを使用してAPIをインストールします。

インストール後、必要なライブラリを開発環境にインポートします。APIキーを使用してAPIを初期化し、Novita AI LLMとの対話を開始します。これはPythonユーザー向けのチャット完了APIの使用例です。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek-v3-0324"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Chatbox経由でDeepSeek V3 0324を使用する
ステップ1: Chatboxをインストールする

- 「Setting」 オプションを選択します。この設定により、Novita AIのようなOpenAI API標準に準拠したAPIとの互換性が確保されます。
- 設定フィールドを入力します:
- Base URL:
https://api.novita.ai/v3/openaiを入力。 - API Key: Novita AI API Key をここに貼り付け。
- Model Name: 先ほどコピーしたモデル名(例:
deepseek/deepseek-v3-0324)を貼り付け。
- Base URL:
- 設定が完了したら、 Done をクリック。
クラウドGPU経由でDeepSeek V3 0324を使用する
ステップ1:アカウントを登録する
Novita AIが初めての方は、当サイトでアカウントを作成してください。登録が完了したら、「GPUs」タブに移動して利用可能なリソースを確認し、旅を始めましょう。

ステップ2:テンプレートとGPUサーバーを探索する
プロジェクトのニーズに合ったテンプレート(PyTorch、TensorFlow、CUDAなど)を選択することから始めます。必要なバージョン(例:PyTorch 2.2.1、CUDA 11.8.0)を選択します。次に、A100 GPUサーバー構成を選択します。これは、十分なVRAM、RAM、ディスク容量で要求の厳しいワークロードを処理する強力なパフォーマンスを提供します。

ステップ3:デプロイメントをカスタマイズする
テンプレートとGPUを選択したら、オペレーティングシステムのバージョン(例:CUDA 11.8)などのパラメータを調整してデプロイメント設定をカスタマイズします。また、他の設定を微調整して、プロジェクトの特定の要件に合わせて環境を調整することもできます。

ステップ4:インスタンスを起動する
テンプレートとデプロイメント設定が確定したら、「Launch Instance」をクリックしてGPUインスタンスをセットアップします。これにより環境のセットアップが開始され、AIタスクにGPUリソースを使用できるようになります。

Novita AIは15のプラットフォームと統合
Novita AIは15のプラットフォームと統合されており、詳細なチュートリアルはドキュメントでご覧いただけます。

DeepSeek V3 0324は、AI機能の大幅な進歩を示し、手頃な価格設定で高いパフォーマンスを提供します。多言語機能、拡張されたコンテキストウィンドウ、関数呼び出しのサポートにより、開発者にとって汎用性の高いツールです。ローカルで使用する場合でも、Novita AI APIを介して使用する場合でも、DeepSeek V3 0324は、自然言語処理からマルチモーダルアプリケーションまで、さまざまなAIタスクに強力なソリューションを提供します。
よくある質問
DeepSeek V3 0324の価格は?
価格は入力トークン100万あたり0.39ドル、出力トークン100万あたり1.3ドルで、Novita AIの開発者にとって費用対効果が高いです。
DeepSeek V3 0324をローカルで実行するために必要なハードウェアは?
このモデルは、約1532 GBのVRAMと各80GBの24x H100 GPU(合計1920 GB)など、かなりのハードウェアリソースを必要とします。
DeepSeek V3 0324は関数呼び出しをサポートしますか?
はい、関数呼び出しを完全にサポートしており、開発者はより複雑なワークフローに統合できます。
Novita AIはAIクラウドプラットフォームで、開発者がシンプルなAPIを使用してAIモデルを簡単にデプロイできるようにするとともに、構築とスケーリングのための手頃で信頼性の高いGPUクラウドを提供します。

