大規模なコードベースや複数ドキュメントのワークフローを管理する開発者は、従来のTransformerモデルを使用する際に、高い計算コスト、不安定な長いコンテキスト性能、一貫性のないコード理解といった持続的な課題に直面しています。これらの制約はイテレーション効率を制限し、リポジトリ規模の分析を制約し、運用コストを増大させます。DeepSeek V3.2の導入は、アテンションのオーバーヘッドを削減し、コンテキスト推論を加速し、コード生成を安定化させるように設計されたメカニズムである**DeepSeek Sparse Attention (DSA)**を統合することで、これらの痛点に対処します。
本記事では、DeepSeek V3.2がコスト効率、長いコンテキスト処理、コードに特化した機能をどのように改善するかを検証します。また、Novita AIとClaude Codeを通じてDeepSeek V3.2をデプロイするための運用ガイダンスを提供します。
ご注意ください! Novita AIは「Build Month」キャンペーンを開始し、開発者向けに全主要製品が最大20%オフになる特別インセンティブを提供しています!
DeepSeek V3.2の新しいコーディング機能とは?
DSAは、モデルが情報を処理する方法を根本的に変革する革新的なアテンションメカニズムです。従来のTransformerでは、すべてのトークンが他のすべてのトークンにアテンションする必要があり、2乗の計算コスト(O(n²))が発生していました。一方、DSAはきめ細かく、かつコンテンツを認識した選択メカニズムを導入します:
- インテリジェントフィルタリング:学習中に、モデルは特定のタスクにとってどのトークン関係が本当に重要かを識別することを学びます。
- 動的結合:入力コンテンツに基づいて、必要なアテンション接続をリアルタイムで選択します。
- タスク最適化:コードと法的文書を処理する際に、異なる構造パターンに焦点を当てます。
DSAによって実現される3つのコア改善点
直接自己適応は、コアアーキテクチャを変更せずにモデル全体のパフォーマンスを向上させる補助メカニズムとして採用されています。このアプローチにより、v3.1と同等のコード生成・分析品質を維持しながら、より経済的な推論を可能にすることで、モデルは大幅なコスト効率を達成し、頻繁なテストと迅速なイテレーションをサポートします。
DSAはまた、最大128Kトークンのコンテキストウィンドウを効果的に活用することで長いコンテキストの利用を強化し、同時マルチファイル分析、ファイル間依存関係の理解、複雑な技術文書の処理を改善します。
さらに、DSAはより高速な推論応答、より正確なコード理解、より安定したコード生成品質など、コード関連機能の向上に貢献し、大規模ソフトウェア開発シナリオにおけるモデルの信頼性と効率を総合的に高めます。
スケーラブルな強化学習フレームワーク
堅牢な強化学習プロトコルを採用し、ポストトレーニングの計算をスケーリングすることで、DeepSeek-V3.2はGPT-5に匹敵する性能を達成します。特に、高計算バリアントであるDeepSeek-V3.2-Specialeは、一貫してGPT-5を上回り、Gemini-3.0-Proと同等の推論能力を示します。
| ベンチマーク | 指標 | DeepSeek-V3.2-Speciale | DeepSeek-V3.2-Thinking | GPT-5-High | Claude-4.5-Sonnet | Gemini-3.0-Pro |
|---|---|---|---|---|---|---|
| AIME 2025 | Pass@1 (%) | 96.0 | 93.1 | 94.6 | 87.0 | 95.0 |
| HMMT 2025 | Pass@1 (%) | 99.2 | 90.2 | 88.3 | 79.2 | 97.5 |
| HLE | Pass@1 (%) | 30.6 | 25.1 | 26.3 | 13.7 | 37.7 |
| Codeforces | Rating | 2701 | 2386 | 2537 | 1480 | 2708 |
| SWE Verified | Resolved (%) | – | 73.1 | 74.9 | 77.2 | 76.2 |
| Terminal Bench 2.0 | Accuracy (%) | – | 46.4 | 35.2 | 42.8 | 54.2 |
| τ² Bench | Pass@1 (%) | – | 80.3 | 80.2 | 84.7 | 85.4 |
| Tool Decathlon | Pass@1 (%) | – | 35.2 | 29.0 | 38.6 | 36.4 |
DeepSeek V3.2:開発者との連携を強化するために行われたこと
推論をツール使用シナリオにうまく統合するために、DeepSeekはV3.2のポストトレーニング段階で大規模エージェントタスク合成パイプラインを導入しました。核となるアイデアは、手作りのプロンプトや限られた人間のデモンストレーションに頼るのではなく、エージェント用のトレーニングデータを体系的な方法で大規模に生成することです。
このパイプラインは、モデルが推論し、決定し、ツールを呼び出し、中間結果を観察し、それに応じて動作を調整する必要があるタスクをプログラム的に構築します。モデルをさまざまな構造化されたインタラクションにさらすことで、DeepSeekはスケーラブルなエージェントのポストトレーニングを可能にし、検索、コーディング、ツール拡張ワークフローなどの複雑で多段階のインタラクティブ環境における行動コンプライアンスと汎化能力の両方を大幅に向上させます。
最も重要な2つのアップデートは以下の通りです:
改訂されたツール呼び出し形式:多段階のインタラクションにおいて、より明示的で安定するように設計されています
「ツールを使った思考」 のネイティブサポート:推論とツール使用が疎にインターリーブされるのではなく、構造的に統合されています
コミュニティがこの新しいテンプレートを理解して採用できるように、DeepSeekは専用の**encodingフォルダ**を提供しています。このフォルダには、OpenAI互換のメッセージをDeepSeek-V3.2が期待する単一の入力文字列にエンコードする方法と、モデルのテキスト出力を構造化メッセージにパースする方法を示すPythonスクリプトとテストケースが含まれています。
import transformers
# encoding/encoding_dsv32.py
from encoding_dsv32 import encode_messages, parse_message_from_completion_text
tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")
messages = [
{"role": "user", "content": "hello"},
{"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
{"role": "user", "content": "1+1=?"}
]
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)
prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)
注目すべきは、今回のリリースにはJinjaベースのチャットテンプレートは含まれていないことです。提供されているPython実装が信頼できるリファレンスです。また、出力解析関数は整形式のモデル出力を前提としており、デモと実験を目的としており、追加のエラーハンドリングなしでの本番利用には適していません。
developerロールが必要な理由
実際のエージェントシナリオでは、モデルはしばしば3つの異なるタイプの情報を同時に処理する必要があります:
- ユーザーの実際の意図またはタスク目標
- モデル自身の推論と意思決定プロセス
- システムまたは開発者によって提供される検索戦略、ツールの制約、実行ルール
以前のバージョンでは、これらのシグナルは通常、ユーザープロンプトまたはシステムプロンプト内に混在していました。時間が経つにつれて、これにより2つの主要な問題が発生しました。第一に、モデルがユーザーの意図と必須の行動制約を区別するのに苦労する可能性があること。第二に、ツールチェーンが複雑になるにつれて、ツール呼び出しの安定性と信頼性が著しく低下したことです。
DeepSeek-V3.2で導入されたdeveloperロールは、基本的に検索エージェントとツール指向エージェントのための専用の制御チャネルとして機能します。これは、検索範囲、ツール使用順序、ポリシー制約など、エージェントの動作に厳密に関連する命令を伝達するために設計されており、通常の会話セマンティクスには関与しません。この明示的な分離により、より明確なコンテキスト理解が可能になり、よりスケーラブルで堅牢なエージェントトレーニングのための構造的基盤が確立されます。
Claude CodeでDeepSeek V3.2にアクセスする方法
Novita AIは現在、最も手頃なフルコンテキストのDeepseek V3.2 APIを提供しています。
Novita AIは65KコンテキストのAPIを提供し、コストは*$0.269/入力および$0.4/出力**で、構造化出力と関数呼び出しをサポートしており、Deepseek V3.2のコードエージェントの可能性を最大化するための強力なサポートを提供します。*
キャッシュ読み取り:$0.1345 / Mトークンは、キャッシュヒット時にキャッシュされたトークンの読み取りコストを示します。これらのトークンは以前に計算されて保存されているため、追加のモデル推論は必要ありません。多くのリクエストが同じプロンプトプリフィックスを共有するシステム、会話履歴、ツール命令、固定ルールテキストを再利用するシステム、またはRAG検索結果が非常に反復的なシステムでは、高いキャッシュヒット率を達成でき、全体的な推論コストを大幅に削減できます。
その1:APIキーを取得する
ステップ1:アカウントにログインし、Model Libraryボタンをクリックします。

ステップ2:モデルを選択する
利用可能なオプションを参照し、ニーズに合ったモデルを選択します。

ステップ3:無料トライアルを開始する
選択したモデルの機能を試すために、無料トライアルを開始します。

ステップ4:APIキーを取得する
APIで認証するために、新しいAPIキーを提供します。「Settings」ページに移動し、画像のようにAPIキーをコピーできます。

ステップ5:APIをインストールする
プログラミング言語に固有のパッケージマネージャーを使用してAPIをインストールします。
インストール後、必要なライブラリを開発環境にインポートします。APIキーを使用してAPIを初期化し、Novita AI LLMとの対話を開始します。これはPythonユーザー向けのチャット補完APIの使用例です。
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="deepseek/deepseek-v3.2",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=65536,
temperature=0.7
)
print(response.choices[0].message.content)
Claude CodeでDeepSeek V3.2を使用する
ステップ1:Claude Codeをインストールする
Claude Codeをインストールする前に、システムが最小要件を満たしていることを確認してください。Node.js 18以上がローカル環境にインストールされている必要があります。ターミナルでnode --versionを実行して、Node.jsのバージョンを確認できます。
Windowsの場合
コマンドプロンプトを開き、以下のコマンドを実行します:
npm install -g @anthropic-ai/claude-code
npx win-claude-code@latest
グローバルインストールにより、システム上の任意のディレクトリからClaude Codeにアクセスできるようになります。npx win-claude-code@latestコマンドは、最新のWindows固有バージョンをダウンロードして実行します。
MacおよびLinuxの場合
ターミナルを開き、以下を実行します:
npm install -g @anthropic-ai/claude-code
Macユーザーは、追加のプラットフォーム固有のコマンドを必要とせずに、そのままグローバルインストールに進むことができます。インストールプロセスは、必要な依存関係とPATH変数を自動的に設定します。
ステップ2:環境変数を設定する
環境変数は、Claude CodeがNovita AIのAPIエンドポイントを通じてDeepseek v3.2を使用するように設定します。これらの変数は、Claude Codeにリクエストの送信先と認証方法を指示します。
Windowsの場合
コマンドプロンプトを開き、次の環境変数を設定します:
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
set ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"
<Novita API Key>を、Novita AIプラットフォームから取得した実際のAPIキーに置き換えてください。これらの変数は現在のセッションでのみ有効であり、コマンドプロンプトを閉じるとリセットする必要があります。
MacおよびLinuxの場合
ターミナルを開き、次の環境変数をエクスポートします:
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"
ステップ3:Claude Codeを起動する
インストールと設定が完了したら、プロジェクトディレクトリでClaude Codeを起動できます。cdコマンドを使用して目的のプロジェクトの場所に移動します:
cd <your-project-directory>
claude .
ドット(.)パラメータは、Claude Codeにカレントディレクトリで動作するよう指示します。起動時に、Claude Codeプロンプトがインタラクティブセッションで表示されます。
これは、ツールが指示を受け取る準備ができていることを示します。このインターフェースは、自然言語プログラミングのインタラクションのためのクリーンで直感的な環境を提供します。
ステップ4:VSCodeまたはCursorでClaude Codeを使用する
Claude Codeは、一般的な開発環境とシームレスに統合されます。既存のワークフローを置き換えるのではなく、強化します。
VSCodeまたはCursor内のターミナルでClaude Codeを直接使用できます。これにより、AIアシスタンスを活用しながら、使い慣れた開発ツールへのアクセスを維持できます。
さらに、VSCodeとCursorの両方でClaude Codeプラグインが利用可能です。
Claude Codeで外部モデルを使用する方法
開発ワークフローで異なる大規模言語モデル(例:AnthropicのClaude、ZhipuのGLM、MoonshotのKimi)を動的に切り替えたい場合、大規模なコード変更なしでそれを実現する戦略があります。このセクションでは、統一APIと設定トグルを使用してモデルを迅速に交換する方法を説明します。
環境変数の使用(Claude Codeのアプローチ):
Claude Codeや特定のAPIに結びついたSDKなどのツールを使用している場合、環境設定を調整するだけでモデルを切り替えることができます。Novita AIは、最適なものを見つけるために試すことができる複数のモデルオプションを提供しています。

DeepSeek V3.2は、DSAをターゲットを絞ったアーキテクチャのアップグレードとして導入し、計算コストを大幅に削減し、長いコンテキストの効果を高め、コード中心の精度を向上させながら、競争力のある推論性能を維持します。このモデルは、大規模なリポジトリや複雑な技術文書のスケーラブルな分析を可能にし、DeepSeek V3.1-Terminusやプロプライエタリな代替品と比較して、効率性と能力のバランスが良好であることを示します。これらの進歩により、DeepSeek V3.2は持続的な開発ワークフローと長いコンテキストのAIアプリケーションのためのコスト効率の高いソリューションとして確立されます。
よくある質問
DeepSeek V3.2内のDeepSeek Sparse Attention (DSA)の主な利点は何ですか?
DeepSeek V3.2はDSAを使用してアテンション接続を選択的にアクティブにし、2乗のアテンションコストを削減しながら、長いコンテキストにわたって正確なコード理解を維持します。
実用的なコーディングワークフローにおいて、DeepSeek V3.2はDeepSeek V3.1-Terminusとどのように異なりますか?
DeepSeek V3.2は、DeepSeek V3.1-Terminusと比較して、運用コストの低減、128Kコンテキストウィンドウ、およびより高速な推論安定性を提供し、より効率的なリポジトリ規模のコード分析を実現します。
DeepSeek V3.2は長いコンテキストの技術文書処理を改善しますか?
はい。DeepSeek V3.2は複雑な文書とファイル間の関係の同時分析をサポートし、マルチドキュメント推論タスクにおいてDeepSeek V3.1-Terminusを上回ります。
Novita AIは、AIの野望を実現するためのオールインワンクラウドプラットフォームです。統合API、サーバーレス、GPUインスタンス — 必要なコスト効率の高いツール。インフラストラクチャを排除し、無料で始めて、AIビジョンを現実にします。
おすすめの記事
Qwen 3 Coderへのアクセス方法:Qwen Code; Claude Code; Trae

