Claude CodeでDeepSeek V4 Flashを使用する：Novita AI経由のセットアップガイド

なぜClaude CodeでDeepSeek V4 Flashを使うのか
DeepSeek V4 Flashとは
Novita AIのAPIキーを取得する
Claude Codeのインストール
環境変数の設定
Claude Codeの起動
大規模なコードベースでの作業
セッションごとの推論モードの選択
まとめ
FAQ
おすすめ記事

DeepSeek V4 Flashは、100万トークンのコンテキストウィンドウを備えた284BのMoEモデルで、Novita AIのAnthropic互換エンドポイントから利用可能です。つまり、Claude Codeは3行の環境変数変更だけで直接使用できます。入力トークンあたり$0.14/M（Claude Sonnetは$3/M）と、コスト差は継続的なエージェントコーディングセッションを実行するチームにとって非常に大きいものです。

なぜClaude CodeでDeepSeek V4 Flashを使うのか

最も直接的な理由は経済性です。Claude CodeのデフォルトはClaude Sonnetで、入力トークンが$3/M、出力トークンが$15/Mです。Novita AI上のDeepSeek V4 Flashは入力が$0.14/M、出力が$0.28/Mで、入力は約20分の1、出力は約50分の1のコストです。8時間勤務でClaude Codeを実行するチームにとって、その差はすぐに積み上がります。

コスト面以外にも、V4 Flashはエージェントコーディングに特に重要な2つの機能を提供します：

100万トークンのコンテキストウィンドウ — Claude Codeはコードベース全体をチャンク分割せずにコンテキストに読み込めます。複数ファイルにわたるリファクタリング、リポジトリ横断的なデバッグ、長い会話履歴も、手動でのコンテキスト管理なしに一貫性を保てます。
選択可能な推論モード — 定型タスクには高速応答の非思考モード、複雑なアーキテクチャ決定や難しいデバッグセッションには思考モードと思考最大モードで段階的推論が可能です。モデルを切り替えずにセッションごとに選択できます。

Novita AIはAnthropic互換エンドポイント（/anthropic）を公開しているため、Claude Codeはそれをドロップイン置換として扱います。SDKの変更もプラグインも不要で、環境変数だけで済みます。

DeepSeek V4 Flashとは

DeepSeek V4 Flash は、DeepSeek AIによるMixture-of-Experts（MoE）モデルです。総パラメータ数は284Bですが、1フォワードパスあたり13Bのみを活性化するため、レイテンシとトークンあたりのコストは13Bの高密度モデルに近く、はるかに大規模なネットワークの知識容量を維持します。

主な仕様は以下の通りです：

仕様	値
モデルID	`deepseek/deepseek-v4-flash`
総パラメータ数	284B（推論ごとに13B活性化）
コンテキストウィンドウ	1,048,576 トークン
最大出力トークン数	393,216
入力価格（Novita AI）	$0.14/M トークン
出力価格（Novita AI）	$0.28/M トークン
キャッシュ読み取り価格	$0.028/M トークン
推論モード	非思考、思考、思考最大
関数呼び出し	対応
構造化出力	対応
ライセンス	MIT

3つの推論モードにより、セッションごとにコストと品質を調整できます。非思考モードは高速で低コストであり、反復的なスキャフォールディングやボイラープレート生成に適しています。思考モードはコードレビュー、アーキテクチャ作業、デバッグに段階的推論を追加します。思考最大モードは最大の推論予算を使用し、ほとんどのコーディングベンチマークでV4 Proに匹敵します。

Novita AIは完全な100万トークンのコンテキストウィンドウと信頼性の高い稼働時間を提供するため、本番環境のエージェントワークロードに実用的な選択肢となります。

Novita AIのAPIキーを取得する

Novita AIアカウントに登録して、無料トライアルクレジットを受け取ります。ログイン後、キー管理ページに移動し、「新しいキーを作成」 をクリックします。

キーはすぐにコピーしてください — 二度と表示されません。パスワードマネージャーやシークレットストアに保管し、次のステップで必要になります。

Claude Codeのインストール

Claude CodeにはNode.js 18以上が必要です。まずバージョンを確認してください：

node --version

Nodeが18未満の場合は、nodejs.org から更新してから続行してください。

Windows

コマンドプロンプトを開き、以下を実行します：

npm install -g @anthropic-ai/claude-code

MacおよびLinux

ターミナルを開き、以下を実行します：

npm install -g @anthropic-ai/claude-code

グローバルインストールにより、claude が任意のディレクトリから使用可能になります。

環境変数の設定

以下の4つの変数により、Claude CodeがDeepSeek V4 FlashをアクティブモデルとしてNovita AIのAnthropic互換エンドポイントにリダイレクトされます。

Windows

set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<あなたのNovita APIキー>
set ANTHROPIC_MODEL=deepseek/deepseek-v4-flash
set ANTHROPIC_SMALL_FAST_MODEL=deepseek/deepseek-v4-flash

これらは現在のコマンドプロンプトセッション中のみ有効です。永続化するには、システムプロパティ → 環境変数 で設定してください。

MacおよびLinux

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<あなたのNovita APIキー>"
export ANTHROPIC_MODEL="deepseek/deepseek-v4-flash"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v4-flash"

セッションを超えて永続化するには、これらの行を ~/.bashrc、~/.zshrc、または同等のシェルプロファイルに追加してください。

ANTHROPIC_SMALL_FAST_MODEL は、ファイル検索やサマリーなどClaude Codeが高速な内部タスクに使用する軽量モデルを制御します。同じモデルIDに設定することで、すべてのトラフィックを単一の請求ラインにまとめ、予期しないAnthropic API呼び出しを回避できます。

Claude Codeの起動

プロジェクトディレクトリに移動し、Claude Codeを起動します：

cd <あなたのプロジェクトディレクトリ>
claude .

Claude Codeがカレントディレクトリでインタラクティブセッションを開きます。Novita AIのエンドポイントへの接続が確立されるとプロンプトが表示されます。ここからタスクを自然言語で説明すると、Claude Codeがファイルを読み込み、変更を提案し、承認とともに適用します。

大規模なコードベースでの作業

100万トークンのコンテキストウィンドウは、小規模コンテキストの代替品と比較したV4 Flashの最も実用的な利点です。一般的な中規模の本番コードベースは、フラット化すると10万〜30万トークンになります。V4 Flashは、チャンク分割戦略なしで全体をコンテキストに保持できます。

直接恩恵を受けるワークフローをいくつか紹介します：

複数ファイルにわたるリファクタリング — データモデルの改名、API契約の変更、サービスインターフェースのリファクタリングを、それを参照するすべてのファイルにわたってClaude Codeに依頼します。完全なコンテキストウィンドウにより、ファイルごとではなくすべての依存関係を同時に認識できます。

長時間のデバッグセッション — デバッグセッションがツール呼び出し、ファイル読み込み、推論トレースを蓄積するにつれ、小さいコンテキストウィンドウでは初期の履歴が切り詰められます。V4 Flashはセッション全体を保持するため、200ツール呼び出し前のパターンについても推論できます。

リポジトリ全体のレビュー — コードベース全体をV4 Flashの思考または思考最大モードに渡し、セキュリティレビュー、アーキテクチャ評価、デッドコード分析を依頼します。これは128Kモデルではすぐに枯渇しますが、V4 Flashのウィンドウには余裕で収まります。

システムプロンプトのオーバーヘッド — Claude Codeは詳細なシステムプロンプトを使用し、1万〜2万トークンになる場合があります。128Kモデルではそのオーバーヘッドが問題になりますが、100万ウィンドウでは無視でき、コンテキスト予算のほとんどすべてを実際のコードに使用できます。

長時間セッションのコスト管理には、非思考モードが定型ファイル編集の大半を最低コストで処理します。設計の推論が必要なタスクには思考モードに切り替え、難しいアルゴリズムやデバッグ問題には思考最大モードを使用します。Novitaのキャッシュ読み取り価格（$0.028/M）は、繰り返しのシステムプロンプト注入が大規模でも非常に低コストであることを意味します。

セッションごとの推論モードの選択

DeepSeek V4 Flashは、セッションごとに制御可能な3つの推論モードをサポートしています。非思考モードは高速で直接的な完了を返し、ボイラープレート生成、定型編集、クイックルックアップに適しています。思考モードはコードレビュー、リファクタリング、アーキテクチャ決定に段階的推論を有効にします。思考最大モードは最大の推論予算を割り当て、ほとんどのコーディングベンチマークでV4 Proに匹敵します。

Claude Codeをより深い推論に向かわせる最も簡単な方法は、カスタムシステムプロンプトです：

claude --system "アーキテクチャの決定や複雑なデバッグには拡張思考を使用してください。"

プログラムによる制御の場合、Novita AIのエンドポイントは budget_tokens パラメータを受け入れます。0 に設定すると思考が完全に無効になり、正の値を設定するとそのトークン予算まで思考が有効になります。これは、特定のステップのみ深い推論が必要なエージェントパイプラインで便利です：

import anthropic

client = anthropic.Anthropic(
    base_url="https://api.novita.ai/anthropic",
    api_key="<あなたのNovita APIキー>",
)

# 思考最大 — 難しい問題に最大の推論予算
response = client.messages.create(
    model="deepseek/deepseek-v4-flash",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 10000},
    messages=[{"role": "user", "content": "この関数の微妙な並行性バグをレビューしてください。"}],
)

コスト重視のセッションでは、非思考モードで開始し、それを必要とする問題に遭遇した場合のみ思考モードに切り替えます。Novitaのキャッシュ読み取り価格は$0.028/Mトークンであるため、長いマルチステップセッションでも繰り返しのシステムプロンプト注入は低コストを維持します。

まとめ

Novita AI上のDeepSeek V4 Flashは、Claude Codeに高性能でコスト効率の高い基盤を提供します — 100万のコンテキスト、選択可能な推論、関数呼び出しをClaude Sonnetの数分の一の価格で実現します。セットアップは5分もかかりません。環境変数を設定すれば、既存のClaude Codeワークフローはそのまま動作します。

Novita AIでDeepSeek V4 Flashをお試しください。さらに設定オプションについては Novita AI LLM APIドキュメントをご覧ください。

FAQ

Claude CodeでNovita AIを使用するにはプラグインや拡張機能が必要ですか？

いいえ。Claude Codeは起動時に ANTHROPIC_BASE_URL 環境変数を読み取り、すべてのAPI呼び出しをそこにルーティングします。プラグイン、拡張機能、コード変更は一切不要で、環境変数のみで切り替えが完了します。

Novita AIを使用する際、Anthropicから請求されますか？

いいえ。ANTHROPIC_BASE_URL がNovita AIを指している場合、すべてのトラフィックと請求はNovita AIアカウントを通じて行われます。Anthropicアカウントは使用されません。

再インストールせずにClaude Sonnetに戻せますか？

はい。ANTHROPIC_BASE_URL と ANTHROPIC_MODEL を設定解除するか、それらのエクスポートがない新しいシェルを開くだけで、Claude CodeはデフォルトのAnthropicエンドポイントとClaude Sonnetに戻ります。

V4 Flashは自動CIパイプラインに適していますか？

V4 Flashは関数呼び出しと構造化出力をサポートしており、これらはClaude Codeが最も重視する2つの機能です。自動化されたコーディングパイプライン、CI統合、コンテキストの継続性とコスト予測可能性が重要な長時間のエージェントセッションに実用的な選択肢です。

コンテキストウィンドウがいっぱいになったらどうなりますか？

1,048,576トークンでは、V4 Flashのコンテキストウィンドウはほとんどのセッションで満杯になりません。非常に長いセッション（数日分の履歴、非常に大規模なリポジトリ）を実行している場合、Claude Codeは最も古いメッセージから切り詰めを開始します。実際には、新しいタスクごとに新しいセッションを開始することが、制限内に収める最も簡単な方法です。

Novita AI は、シンプルなAPIを使用してAIモデルを簡単にデプロイできる機能を開発者に提供し、同時に手頃で信頼性の高いGPUクラウドをスケーリングに提供するAIクラウドプラットフォームです。

Claude CodeでDeepSeek V4 Flashを使用する：Novita AI経由のセットアップガイド

なぜClaude CodeでDeepSeek V4 Flashを使うのか

DeepSeek V4 Flashとは

Novita AIのAPIキーを取得する

Claude Codeのインストール

Windows

MacおよびLinux

環境変数の設定

Windows

MacおよびLinux

Claude Codeの起動

大規模なコードベースでの作業

セッションごとの推論モードの選択

まとめ

FAQ

おすすめ記事

Product

RESOURCES

Partners

Company

なぜClaude CodeでDeepSeek V4 Flashを使うのか

DeepSeek V4 Flashとは

Novita AIのAPIキーを取得する

Claude Codeのインストール

Windows

MacおよびLinux

環境変数の設定

Windows

MacおよびLinux

Claude Codeの起動

大規模なコードベースでの作業

セッションごとの推論モードの選択

まとめ

FAQ

おすすめ記事

関連記事

Product

RESOURCES

Partners

Company