DeepSeek-R1-0528 と DeepSeek-R1-0528-Qwen3-8B が Novita AI で利用可能に

DeepSeek-R1-0528 と DeepSeek-R1-0528-Qwen3-8B が Novita AI で利用可能に

DeepSeek は、2 つの革新的なモデル、DeepSeek-R1-0528 と DeepSeek-R1-0528-Qwen3-8B をリリースし、これらは現在、シンプルな API で簡単な AI モデルデプロイを提供する AI クラウドプラットフォーム Novita AI で利用可能です。これらのモデルは、競争力のある価格で卓越した推論能力を提供し、前世代よりも大幅に優れたパフォーマンスを発揮します。

Novita AI は、両方の DeepSeek-R1-0528 モデルを競争力のある料金で、透明性の高い従量課金制で提供しています:

DeepSeek-R1-0528 (フルモデル):

  • 入力トークン:100万トークンあたり $0.7
  • 出力トークン:100万トークンあたり $2.5

DeepSeek-R1-0528-Qwen3-8B (効率的な 8B モデル):

  • 入力トークン:100万トークンあたり $0.06
  • 出力トークン:100万トークンあたり $0.09

DeepSeek-R1-0528 デモを試す

DeepSeek-R1-0528 とは?

DeepSeek R1 モデルはマイナーバージョンアップグレードが行われ、現在のバージョンは DeepSeek-R1-0528 です。この最新アップデートでは、DeepSeek R1 は、計算リソースの増加と、ポストトレーニング時のアルゴリズム最適化メカニズムの導入により、推論の深さと推論能力が大幅に向上しました。

このモデルは、数学、プログラミング、一般論理など、さまざまなベンチマーク評価で優れたパフォーマンスを示しています。その全体的なパフォーマンスは、O3 や Gemini 2.5 Pro などのリーディングモデルに近づいています。

DeepSeek-R1-0528 の主な改善点

🔹 ベンチマークパフォーマンスの向上(数学、コーディング、推論タスクにおいて)
🔹 フロントエンド機能の強化 によるユーザーエクスペリエンスの向上
🔹 幻覚の低減 によるより信頼性の高い出力
🔹 JSON 出力と関数呼び出しのサポート によるシームレスな統合

推論の深さの向上

以前のバージョンと比較して、アップグレードされたモデルは、複雑な推論タスクの処理において大幅な改善を示しています。例えば、AIME 2025 テストでは、モデルの精度が以前のバージョンの 70% から現在のバージョンの 87.5% に向上しました。

この進歩は、推論プロセス中の思考の深さの向上に起因します。AIME テストセットでは、以前のモデルは質問ごとに平均 12K トークンを使用していたのに対し、新しいバージョンでは質問ごとに平均 23K トークンを使用しています。

業界リーダーとの競争力のあるパフォーマンス

DeepSeek-R1-0528 は、複数の挑戦的なベンチマークにおいて、業界をリードするモデルと比較して顕著なパフォーマンスを示しています。

deepseek r1 0528 benchmark

DeepSeek-R1 vs DeepSeek-R1-0528

数学的推論パフォーマンス

ベンチマーク DeepSeek R1 DeepSeek R1-0528 改善
AIME 2024 (Pass@1) 79.8 91.4 +11.6
AIME 2025 (Pass@1) 70.0 87.5 +17.5
HMMT 2025 (Pass@1) 41.7 79.4 +37.7
CNMO 2024 (Pass@1) 78.8 86.9 +8.1

コーディングパフォーマンスの強化

ベンチマーク DeepSeek R1 DeepSeek R1-0528 改善
LiveCodeBench (Pass@1) 63.5 73.3 +9.8
Codeforces-Div1 (Rating) 1530 1930 +400
SWE Verified (Resolved) 49.2 57.6 +8.4
Aider-Polyglot (Acc.) 53.3 71.6 +18.3

一般的な推論タスク

ベンチマーク DeepSeek R1 DeepSeek R1-0528 改善
MMLU-Redux (EM) 92.9 93.4 +0.5
MMLU-Pro (EM) 84.0 85.0 +1.0
GPQA-Diamond (Pass@1) 71.5 81.0 +9.5
SimpleQA (Correct) 30.1 27.8 -2.3
FRAMES (Acc.) 82.5 83.0 +0.5
Humanity’s Last Exam (Pass@1) 8.5 17.7 +9.2

新しいツール統合機能

DeepSeek-R1-0528 は、関数呼び出しとツール統合における強化された機能を導入しています:

  • BFCL_v3_MultiTurn (Acc): 37.0%
  • Tau-Bench (Pass@1): 53.5% (航空会社) / 63.9% (小売)

DeepSeek-R1-0528-Qwen3-8B:コンパクトな卓越性

DeepSeek は、DeepSeek-R1-0528 の思考連鎖を蒸留して、Qwen3 8B Base から DeepSeek-R1-0528-Qwen3-8B を作成しました。このモデルは、AIME 2024 においてオープンソースモデルの中で最先端 (SOTA) のパフォーマンスを達成し、Qwen3-8B を +10.0% 上回り、Qwen3-235B-thinking のパフォーマンスに匹敵します。

これは、DeepSeek-R1-0528 の思考連鎖が、推論モデルに関する学術研究と、小規模モデルに焦点を当てた産業開発の両方にとって重要であることを示しています。

主要モデルとの競争力分析

モデル AIME 24 AIME 25 HMMT Feb 25 GPQA Diamond LiveCodeBench
Qwen3-235B-A22B 85.7 81.5 62.5 71.1 66.5
Qwen3-32B 81.4 72.9 - 68.4 -
Qwen3-8B 76.0 67.3 - 62.0 -
Phi-4-Reasoning-Plus-14B 81.3 78.0 53.6 69.3 -
Gemini-2.5-Flash-Thinking-0520 82.3 72.0 64.2 82.8 62.3
o3-mini (medium) 79.6 76.7 53.3 76.8 65.9
DeepSeek-R1-0528-Qwen3-8B 86.0 76.3 61.5 61.1 60.5

使用方法の改善と技術詳細

強化されたユーザビリティ機能

以前のバージョンの DeepSeek-R1 と比較して、DeepSeek-R1-0528 の使用推奨事項には以下の改善が含まれています:

  • システムプロンプトのサポート:以前のバージョンとは異なり、一貫したコンテキストと指示を提供するためにシステムプロンプトを使用できるようになりました。
  • 自動思考パターン:手動でのアクティベーションは不要で、モデルは自動的に推論能力を作動させ、出力の先頭に「thinking」を必要としません。

DeepSeek-R1-0528-Qwen3-8B のアーキテクチャ

DeepSeek-R1-0528-Qwen3-8B のモデルアーキテクチャは Qwen3-8B と同じですが、トークナイザー設定は DeepSeek-R1-0528 と同じです。このモデルは Qwen3-8B と同じ方法で実行できますが、すべての設定ファイルが元の Qwen3 プロジェクトではなく、DeepSeek のリポジトリから取得されていることを確認してください。

開発者が Novita AI を選ぶ理由

簡素化された AI モデルデプロイ

  • インフラストラクチャの手間なし:サーバー管理ではなく、アプリケーション構築に集中できます。
  • 即時モデルアクセス:1 回の API 呼び出しで最先端のモデルをデプロイできます。
  • 信頼性の高いパフォーマンス:99.9% のアップタイムを誇るエンタープライズグレードのインフラストラクチャ。
  • グローバルな可用性:世界中どこからでも低レイテンシでアクセス可能。

あらゆる規模に最適

  • 迅速なプロトタイピング:即座にモデルにアクセスしてアイデアを素早くテスト。
  • プロダクション対応:プロトタイプからプロダクションまでシームレスにスケール。
  • コスト効率:透明性のある料金で使用した分だけ支払い。
  • エンタープライズサポート:大量使用アプリケーション向けの専用サポート。

理想的なユースケース

  • 数学的 AI アプリケーション:AIME 2025 で 87.5% の精度を達成するチュータリングプラットフォームの構築。
  • コード生成ツール:LiveCodeBench で 73.3% の成功率を持つ開発アシスタントの作成。
  • 研究プラットフォーム:業界リーダーと競合する推論モデルのデプロイ。
  • 教育ソフトウェア:ステップバイステップの問題解決アプリケーションの開発。

Novita AI の始め方

  1. Novita AI で サインアップ(数秒)し、$10 の無料クレジット を入手。
  2. DeepSeek-R1-0528(フル機能)または DeepSeek-R1-0528-Qwen3-8B(効率的)を探索。
  3. ダッシュボードから API キーを取得
  4. OpenAI 互換のエンドポイントを使用して 最初の API 呼び出しを行う
  5. 業界をリードする推論能力で 構築を開始

Python ユーザー向け:

from openai import OpenAI

base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"

client = OpenAI(
    base_url=base_url,
    api_key=api_key,
)

stream = True # or False
max_tokens = 1000

response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    extra_body={
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

結論

DeepSeek-R1-0528 シリーズモデルは、競争力のある価格で業界をリードするパフォーマンスを提供します。AIME 2024 で 91.4%、LiveCodeBench で 73.3% を達成し、OpenAI-o3 や Gemini-2.5-Pro の能力に匹敵します。

Novita AI の開発者向けプラットフォームを通じて、インフラストラクチャの複雑さを伴わずに、これらの最先端モデルにすぐにアクセスできます。透明性のある料金、$10 の無料クレジット、直感的な API により、ワールドクラスの推論をアプリケーションに統合することがこれまでになく簡単になりました。

Novita AI は、開発者がシンプルな API を使用して AI モデルを簡単にデプロイできる AI クラウドプラットフォームであり、同時に手頃で信頼性の高い GPU クラウドを構築とスケーリングのために提供しています。