Novita AI では、DeepSeek モデルが以前の 128K から大幅に向上し、コンテンツ長 160K をサポートするようにアップグレードされたことを発表できることを嬉しく思います。このアップグレードにより、より大規模なデータセットを一度に処理および分析できるようになり、時間を節約し、効率を向上させることができます。期間限定で、新規ユーザーは 10ドルの無料クレジット を利用して、アップグレードされた DeepSeek モデルやその他のさまざまな LLM API を Novita AI で探索できます。
DeepSeek-R1-0528
はじめに
DeepSeek R1 0528 は、**2025年5月28日 ** にリリースされた、約 **6850億 ** パラメータを持つ ** オープンソース大規模モデル ** です。推論時にトークンあたり約 **370億 ** パラメータを活性化する Mixture-of-Experts (MoE) アーキテクチャを採用しています。最大コンテキスト長は 128K トークン をサポートします。
このモデルは、チャット 、 推論 、 コーディング 、 数学 、 関数呼び出し ** に優れており、JSON 出力 ** や ** 関数呼び出しインターフェース ** のサポートも追加され、 複雑なタスク ** を処理する能力が大幅に向上しています。 ウェブコンテンツ 、 コード 、 数学データ 、 ドキュメント ** を含む 10兆トークン ** 以上のデータでトレーニングされており、 英語 ** と ** 中国語 ** の ** バイリンガル機能** に重点を置いています。
トレーニングでは、従来の Reinforcement Learning from Human Feedback (RLHF) と ** ファインチューニング手法 ** を採用し、後半では ** 大規模な計算リソース ** と ** アルゴリズムの最適化 ** を組み合わせています。このアプローチは効率よりも ** 正確性 ** と ** 信頼性 ** を優先しており、特に ** 複雑な推論 ** や ** 高精度 ** が要求される ** エンタープライズアプリケーション** に適しています。
ベンチマーク

DeepSeek-V3-0324
はじめに
DeepSeek V3 0324 は、2025年3月25日にリリースされた、約 6710億 パラメータを持つオープンソース大規模モデルであり、推論時にトークンあたり約 370億 パラメータを活性化します。Mixture-of-Experts (MoE) アーキテクチャを採用し、最大コンテキスト長 160K トークン をサポートしており、超長文の入力処理と拡張出力の生成に非常に優れています。
このモデルは、マルチターン会話 、 深い推論 、 コード生成 、 数学的問題解決 ** などのタスクで優れた性能を発揮するように設計されています。特に ** 中国語 ** の多言語サポートが強化され、 テキスト間マルチモーダル機能 ** により汎用性がさらに向上しています。トレーニングデータには、ウェブコンテンツ、コードベース、技術ドキュメントなど、多様なソースから収集された 14.8兆トークン が含まれており、複雑なアプリケーション向けの堅牢な知識ベースを確保しています。
DeepSeek V3 0324 は、高度な 事前学習技術 ** と、特定のユースケースに合わせた ** 事後学習のファインチューニング ** を採用しています。この包括的なアプローチと大規模な計算リソースにより、正確性、一貫性、信頼性が優先され、 長文コンテンツ生成 、 複雑な問題解決 、 エンタープライズグレードのパフォーマンス** が求められる業界に最適なモデルとなっています。
ベンチマーク

コンテンツ長
コンテンツ長とは?
DeepSeek のような AI モデルの文脈では、コンテンツ長 とは、モデルが単一のインタラクションで処理および生成できる最大トークン数(単語、句読点、記号)を指します。これは、モデルが一度に理解できる入力の量と、生成できる出力の量を定義します。コンテキストウィンドウが大きいほど、AI モデルはより長い入力を処理し、各出力により多くの情報を組み込むことができます。
コンテンツ長はパフォーマンスにどのように影響しますか?
コンテンツ長は、モデルの以下の能力に大きく影響します。
- コンテキストの理解: コンテキストウィンドウが長いほど、モデルは入力からより多くの情報を参照できるため、重要な詳細を見逃す可能性が低くなります。
- 一貫性のある出力の生成: 完全なコンテキストにアクセスできるため、モデルは長い出力にわたって論理的な一貫性を維持した応答を生成できます。
- 複雑な推論の実現: マルチステップの推論や履歴状態の追跡が必要なタスク(コーディング、技術分析、詳細な調査など)は、拡張されたコンテキストから大きな恩恵を受けます。
160K トークン拡張の利点
最近のアップグレードにより、DeepSeek-V3-0324 と DeepSeek-R1-0528 は 160K トークン制限 をサポートするようになりました。これは以前の 128K コンテキストウィンドウからの大幅な飛躍です。この拡張には、いくつかの重要な利点があります。
- 超長文会話のサポート: 拡張されたコンテキストウィンドウにより、以前のやりとりを見失うことなくシームレスなマルチターン対話が可能になり、長期的な一貫性と記憶を必要とするタスクに最適です。
- 詳細なエージェント分析の促進: エージェントは、より大規模なデータセットを分析したり、長期間にわたってより深い推論を実行したりできるようになり、ビジネスインテリジェンスや科学研究などのアプリケーションに新たな可能性をもたらします。
- 長文出力アプリケーションの実現: ** コード生成 、 ドキュメント要約 、 詳細レポート生成** などのタスクで、より大規模で複雑な入力を処理し、単一の出力で包括的な結果を提供できるようになりました。
コンテンツ長を拡張することで、DeepSeek は現代のワークフローの要求にさらに適応できるようになり、さまざまな業界のユーザーにとって強力なツールとなっています。
Novita AI 経由で DeepSeek にアクセスする
ステップ1: ログインしてモデルライブラリにアクセス
アカウントにログインし、Model Library ボタンをクリックします。

ステップ2: モデルを選択
利用可能なオプションを参照し、ニーズに合ったモデルを選択します。

ステップ3: 無料トライアルを開始
無料トライアルを開始して、選択したモデルの機能を試してください。

ステップ4: API キーを取得
API で認証するために、新しい API キーを提供します。「Settings」ページに移動し、画像の指示に従って API キーをコピーします。

ステップ5: API をインストール
ご使用のプログラミング言語に適したパッケージマネージャーを使用して API をインストールします。

インストール後、必要なライブラリを開発環境にインポートします。API キーを使用して API を初期化し、Novita AI LLM との対話を開始します。以下は、Python ユーザーが DeepSeek R1 0528 にアクセスするための chat completions API の使用例です。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="session_r5eB9eC3oBfDyuGn69eevTLAudts6AFa3JeHeml91oVyVe6uZnGUmAh7aO9rZxUSRocPWUBszQaiC39g4VGiAg==",
)
model = "deepseek/deepseek-r1-0528"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Novita AI では、コンテキスト長を拡張した DeepSeek R1 0528 と DeepSeek V3 0324 の両方を提供しており、より長い会話やより複雑なプロジェクトを処理できます。DeepSeek R1 0528 は 100万入力/出力トークンあたりわずか $0.7/$2.5、DeepSeek V3 0324 はさらに手頃な $0.28/$1.14 (100万トークンあたり) で、予算を超えることなく最先端の AI パフォーマンスにアクセスできます。期間限定で、新規ユーザーは 10ドルの無料クレジット を利用して、アップグレードされた DeepSeek モデルやその他のさまざまな LLM API を Novita AI で探索できます。
よくある質問
Deepseek V3 0324 とは何ですか?
Deepseek V3 0324 は、DeepSeek による最先端の大規模言語モデルであり、一般的な会話、理解、高度な推論向けに設計されています。
拡張されたコンテキスト長はコーディングプロジェクトにどのように役立ちますか?
コンテキストが拡張されることで、コードベース全体を共有し、複数のファイルにわたってコンテキストを維持し、コードの各部分間の依存関係や関係性を見失うことなく、複雑なリファクタリングタスクに取り組むことができます。これにより、AI が正確でコンテキストに関連した提案を提供する能力が大幅に向上します。
LLM にとって適切なコンテキスト長とは?
ほとんどのアプリケーションでは、32K~128K トークンで優れたパフォーマンスが得られますが、Novita AI のアップグレードされた 160K コンテキスト長により、最も複雑なドキュメントや長時間の会話でも制限なく処理できます。
Novita AI について
Novita AI は、シンプルな API を使用して開発者が簡単に AI モデルをデプロイできるようにするとともに、手頃な価格で信頼性の高い GPU クラウドを提供する AI クラウドプラットフォームです。
