AIエージェントサンドボックスの料金モデル:セッション単位、コンピュート、ストレージ、エグレス

AIエージェントサンドボックスの料金モデル:セッション単位、コンピュート、ストレージ、エグレス

AIエージェントサンドボックスプラットフォームに導入する前に、その料金モデルが実際のワークロードにどのように適合するかを理解しましょう。サンドボックスのコストは単なるコンピューティングレートだけではありません。セッション料金、リソース層、ストレージ、エグレス、パッケージキャッシュの動作、アイドル時間の処理が組み合わさったものです。一つの要素を見誤ると、実際のコーディングエージェントやブラウザ自動化ワークフローのコスト見積もりが一桁ずれてしまう可能性があります。

このガイドでは、各料金軸を分解し、一般的なワークロードでの相互関係を示し、導入前にコストを評価するための比較フレームワークを提供します。

サンドボックス料金の実際の仕組み

ほとんどのマネージドサンドボックスプロバイダーは、以下の組み合わせで請求します。

  • コンピュート時間: サンドボックスが実行されている間の、秒(または分)あたりの消費CPUとRAM
  • セッションオーバーヘッド: セッション開始ごとの定額料金、または短時間実行でも適用される最低請求単位
  • ストレージ: 無料枠を超えた永続ボリューム容量
  • エグレス: アウトバウンドデータ転送(通常GB単位で計測)
  • サブスクリプション層: より高い同時実行数、長時間セッション、カスタムリソース構成を可能にする月額最低料金

自動一時停止が可能なアイドル状態のサンドボックスで利益を上げているプロバイダーはいませんが、すべてのプロバイダーが同じ方法で自動一時停止を実装しているわけではありません。料金モデルのエッジケースは、表面的なレートと同じくらい重要です。

セッション単位の料金

一部のプロバイダーは、実行時間や使用リソースに関係なく、起動するサンドボックスごとに定額料金を請求します。他のプロバイダーはセッションオーバーヘッドなしでコンピュート時間のみを請求します。

セッション単位の課金が最も重要になるのは、高頻度で短期間のワークロード、例えばチャットセッションのユーザーターンごとにサンドボックスを生成して破棄するコードインタプリタのような場合です。セッション開始コストが $0.001 で、アプリケーションが1日あたり10,000セッションを実行する場合、コンピュートがカウントされる前に、セッション料金だけで1日 $10 になります。

確認すべき質問: プロバイダーはセッションごとに最低料金を請求しますか、それとも実際のコンピュート時間のみですか? 最小請求単位は何ですか(秒単位、分単位、5分単位)?

Novita Agent Sandbox の場合、追加のセッション開始料金なしで、実際のvCPUとメモリ使用量に基づいて秒単位で請求されます。2026年半ば時点の価格:1 vCPU が $0.0000098/s、メモリが $0.0000016/GiB/s。1 vCPU + 512 MiB RAM での5分間の短いタスクの場合、合計約 $0.0032 です。(出典:Novita AIの料金ページ、公開されているNovitaドキュメントで確認済み。)

E2B Pro の場合(Novitaの公開比較記事で文書化されている通り)、1 vCPU は $0.0000140/s、メモリは $0.0000045/GiB/s で、カスタムCPU/RAM構成と24時間のセッション長にアクセスするには月額 $150 のサブスクリプションが必要です。

導入前に各プロバイダーの料金ページで現在のレートを必ず確認してください。この市場ではサンドボックスの料金は活発に変化しています。

コンピュート層:vCPU とメモリ

コンピュートは、ほとんどのサンドボックスワークロードにおいて支配的なコストです。変数は以下の通りです。

  • vCPU数: ほとんどのプロバイダーはvCPUごとに線形に請求します
  • メモリ: GiB/s 単位で請求され、通常はコンピュートよりも低いレートです
  • 構成の柔軟性: 固定層(例:1/2/4/8 vCPU)を提供するプロバイダーもいれば、任意の割り当てを許可するプロバイダーもいます

バッチエージェントワークロード(多くの短いタスクを並行して実行する場合)では、メモリとvCPUの比率が重要です。大規模なCSVを読み込むデータ分析タスクでは、4 GiB RAM が必要でも vCPU は1つで十分な場合があります。必要なのは1 vCPU + 4 GiB なのに、固定の4 vCPU + 4 GiB 層に支払うと、タスクごとに3つのCPU分の請求時間を無駄にすることになります。

確認すべき質問: vCPUとメモリを独立して構成できますか? 最小割り当てはありますか? サンドボックス内でモデル推論が必要な場合、どのGPU層が利用可能ですか?

実際的な意味合い:リソースごとに柔軟な請求を行うプロバイダーは、混合ワークロード(一部はCPU主体、一部はメモリ主体)を実行するチームに、固定コンピュートバンドルを提供するプロバイダーよりも優れたコスト管理を提供します。

ストレージ:エフェメラル vs 永続

サンドボックスストレージには、請求動作が異なる2つの形式があります。

エフェメラルストレージ は、セッション中のサンドボックスのローカルファイルシステムです。サンドボックスが終了すると消えます。ほとんどのプロバイダーは無料割り当て(10~20 GBが一般的)を含んでおり、その範囲内では追加料金はかかりません。

永続ストレージ はセッションをまたいで存続します。エージェントがチェックポイント、生成ファイル、キャッシュされたアーティファクト、次回使用可能にする必要があるワークスペースの状態などを保存する場所です。永続ボリュームは通常、クラウドブロックストレージの料金と同様に、月間GB単位で請求されます。

コストの落とし穴:エージェントが大規模な中間ファイル(ログ、モデル出力、生データ)を生成し、それらがクリーンアップされずに永続ストレージに蓄積されると、ストレージ料金は時間とともに増加します。1日1 GBの出力を生成し、30日間すべてを保持するエージェントは、気付かないうちに30 GBのストレージを蓄積します。

確認すべき質問: サンドボックスごとの無料エフェメラルストレージ割り当てはどれくらいですか? 永続/ワークスペースストレージは利用可能ですか?また、どのように価格設定されていますか? サンドボックスの最大ディスクサイズはありますか? スナップショットやテンプレートのストレージ料金はありますか?

Novita Agent Sandbox には、20 GBの無料サンドボックスストレージが含まれています。無料枠を超えた永続ストレージの価格は、現在の料金ページで確認する必要があります。

エグレスとネットワーク料金

エグレス料金は開発中は見えにくいため、プロダクション規模で初めて顕在化し、開発者を驚かせます。

ほとんどのマネージドクラウドプロバイダーは以下に対して課金します。

  • サンドボックスからパブリックインターネットへの アウトバウンドデータ転送
  • サンドボックスリージョンがアプリケーションサーバーと異なる場合の クロスリージョンデータ転送
  • サンドボックス内での 大容量ファイルのダウンロード(例:データセット、モデルウェイト、npmパッケージのダウンロード)

外部データをプルするサンドボックスワークロード(ページを取得するブラウザ自動化エージェント、データセットをダウンロードするデータエージェント、リポジトリをクローンするコーディングエージェント)は、規模が大きくなると substantial なエグレスを生成する可能性があります。500 MBのリポジトリを毎セッションでクローンし、1日1,000セッション実行するコーディングエージェントは、1日500 GBのエグレス転送を行います。

確認すべき質問: プロバイダーはアウトバウンドエグレスに料金を請求しますか? レートはいくらですか? インバウンドデータ(サンドボックスへのアップロード)も課金されますか? 低料金プランではエグレスに上限やスロットリングがありますか?

多くのサンドボックスプロバイダーは明確なエグレス料金を公開しておらず、代わりにプラットフォーム全体のネットワークコスト概要に含めています。規模拡大の前に明確な回答を得てください。

パッケージキャッシュの経済性

Pythonパッケージ、npm依存関係、システムパッケージを毎回サンドボックス内にインストールすることは、コストだけでなく時間的にも高くつきます。新しい pip install torch は数分かかり、セッションごとに significant なコンピュート課金を追加する可能性があります。

プロバイダーはこれを異なる方法で処理します。

キャッシュなし: すべてのサンドボックスはベースイメージから起動し、毎回パッケージをゼロからインストールします。起動レイテンシは高く、コンピュート課金にはインストール時間が含まれます。

テンプレート/スナップショットキャッシュ: パッケージがインストールされたプレビルドのサンドボックステンプレートを作成します。セッションはそのスナップショットから起動します。起動は高速で、パッケージインストールのコンピュートはテンプレート構築時に一度支払われ、セッションごとではありません。

暗黙的レイヤーキャッシュ: 一部のプロバイダーは、同じイメージのサンドボックス間でパッケージレイヤーを自動的にキャッシュします(Dockerレイヤーキャッシュと同様)。これにより、頻繁に使用されるパッケージは再ダウンロードされるのではなく、キャッシュからプルされます。

経済性:5分のエージェントタスクに毎回2分のパッケージインストールが必要な場合、コンピュート請求額の40%をセットアップに費やしており、作業には費やしていないことになります。テンプレートまたはスナップショットは、テンプレートストレージのコストと管理の複雑さと引き換えに、そのオーバーヘッドを排除します。

確認すべき質問: プロバイダーはサンドボックステンプレートまたはスナップショットをサポートしていますか? テンプレートはテンプレートごとに課金されますか、それともセッションがテンプレートから起動する場合のみですか? テンプレートイメージはどのくらいの頻度で再構築する必要がありますか(例:ベースパッケージが更新された場合)?

Novita Agent Sandbox は、プレビルド環境用のテンプレートをサポートしています。一貫したパッケージセットに対して高頻度のタスクを実行するチームは、テンプレートストレージコストと、セッションごとのパッケージインストール時間の節約を比較検討する必要があります。ほとんどのワークロードでは、テンプレートはすぐに元が取れます。

アイドル時間と自動一時停止

エージェントのステップ間でアイドル状態になるサンドボックスは、お金の無駄です。LLMの応答を待つ間30秒間一時停止するエージェントは、サンドボックスが実行中であればコンピュート課金が発生し続けます。

自動一時停止 / 自動再開(一時停止/再開、アイドル時スナップショットとも呼ばれる)とは、コードが実行されていないときにサンドボックスがフリーズされ、アクティブなコンピュートに対してのみ課金されることを意味します。これにより、LLM待機ギャップが長いワークフロー(例えば、LLMが各コードスニペットを生成するのに10秒かかり、その10秒間サンドボックスがアイドル状態になるマルチターンコーディングエージェントなど)のコストを大幅に削減できます。

確認すべき質問: プロバイダーは自動一時停止をサポートしていますか? 一時停止のトリガーは何ですか(アイドル時間のしきい値、明示的なAPI呼び出し)? 再開はどのくらい高速ですか(1秒未満、それともコールドスタートに近い)? 一時停止中のサンドボックスと実行中のサンドボックスで請求に違いはありますか?

トレードオフ:再開が遅い自動一時停止は、エージェントの各ステップにレイテンシを追加します。レイテンシに敏感な対話型ワークロードでは、サンドボックスをウォーム状態に保ち(アイドル時間に支払う)ことが正しい選択かもしれません。一晩中実行されるバッチワークロードでは、自動一時停止はほとんどの場合価値があります。

セルフホスト:隠れたコストモデル

セルフホストまたはBYOC(Bring Your Own Cloud)サンドボックスデプロイメントは、マネージドクラウドサービスとは根本的に異なるコスト構造を持っています。インフラストラクチャの請求額はコンピュート単位あたり低くなりますが、運用オーバーヘッドは現実のものです。

セルフホストで支払うもの:

  • VMまたはベアメタルコスト(通常、マネージドサンドボックスレートよりも低いクラウドスポット/リザーブドレート)
  • ストレージ:EBS/永続ボリューム、スナップショットストレージ、クラウドアカウントからのアウトバウンドエグレス
  • 運用エンジニアリング時間:プロビジョニング、スケーリング、パッチ適用、セキュリティ強化、インシデント対応
  • 可観測性インフラストラクチャ:サンドボックスライフサイクルイベントのログ、メトリクス、トレース
  • コンプライアンス作業:SOC 2、HIPAA、または同様の管理が必要な場合、その作業はチームにのしかかります

よくある間違いは、セルフホストのコンピュートレートとマネージドサンドボックスのレートを比較し、セルフホストオプションの方が安いと結論付けることです。特に、サンドボックスインフラストラクチャを専任で担当できるプラットフォームエンジニアが3人未満のチームでは、運用とコンプライアンスのオーバーヘッドがインフラストラクチャの節約額を上回ることがよくあります。

セルフホストが適しているケース:

  • 既存のクラウドインフラストラクチャとプラットフォームエンジニアリング能力を持つチーム
  • データを特定のクラウドアカウントやリージョンから出せない規制環境
  • 大量のワークロードで、規模が大きくなったときのマネージドとセルフホストのコスト差が運用オーバーヘッドを上回る場合

Novita Agent Sandbox は、コンプライアンスやネットワークポリシーの理由でサンドボックスを自社のVPC内で実行する必要があるチームのために、AWSまたはGCPアカウントへのBYOCデプロイメントをサポートしています。E2Bは現在、標準ProプランのオプションとしてBYOCを文書化していませんが、これは変更される可能性があります。評価時点で各プロバイダーに確認してください。

3つの一般的なワークロードのコスト見積もり

これらの見積もりは、Novitaの文書化された価格を参考にしています。実際のvCPU、メモリ、セッション時間、1日あたりのセッション数に合わせて見積もりを調整してください。これらの数値を予算計画に使用する前に、必ず現在のレートを確認してください。

ワークロード1:コーディングエージェント(対話型、短いセッション)

  • プロファイル:1 vCPU、1 GiB RAM、平均10分のセッション、1日500セッション
  • コンピュート:(0.0000098 × 600s) + (0.0000016 × 1 × 600s) = $0.00588 + $0.00096 = セッションあたり約 $0.007
  • 1日あたり:約 $3.50/日、1日500セッションで約 $105/月
  • 主要変数:パッケージキャッシュ — テンプレートがない場合、セッションごとに2~3分のインストール時間が追加されます

ワークロード2:データ分析エージェント(中程度のセッション、より大きなメモリ)

  • プロファイル:2 vCPU、4 GiB RAM、平均30分のセッション、1日100セッション
  • コンピュート:(0.0000196 × 1800s) + (0.0000016 × 4 × 1800s) = $0.03528 + $0.01152 = セッションあたり約 $0.047
  • 1日あたり:約 $4.70/日、1日100セッションで約 $141/月
  • 主要変数:出力ファイルの保持 — 各セッションが100 MBの保存済み出力を生成する場合、1日100セッション = 1日10 GBのストレージ蓄積

ワークロード3:ブラウザ自動化エージェント(長時間セッション、ネットワーク負荷大)

  • プロファイル:2 vCPU、2 GiB RAM、平均60分のセッション、1日50セッション
  • コンピュート:(0.0000196 × 3600s) + (0.0000016 × 2 × 3600s) = $0.07056 + $0.01152 = セッションあたり約 $0.082
  • 1日あたり:約 $4.10/日、1日50セッションで約 $123/月
  • 主要変数:エグレス — ブラウザエージェントがセッションあたり10 MBのページデータを取得する場合 × 50セッション = 1日500 MBの潜在的なエグレス料金

これらの見積もりには、サブスクリプション料金、エグレス、永続ストレージは含まれていません。月額サブスクリプション最低料金があるプロバイダーの場合は、比較する前にその固定費を追加してください。

サンドボックスベンダーに尋ねるべき質問

サンドボックスプロバイダーをコスト評価する際には、このリストを使用してください。

課金モデル

  • 課金は秒単位、分単位、それともより大きな単位ですか?
  • セッションごとの最低料金や開始料金はありますか?
  • カスタムリソース構成や長時間セッションにアクセスするために、月額サブスクリプションが必要ですか?

コンピュート

  • vCPUとメモリは独立して構成できますか?
  • vCPU/メモリの最小および最大割り当てはいくらですか?
  • GPUアタッチされたサンドボックスは利用可能ですか?また、どのように課金されますか?

ストレージ

  • サンドボックスごとにどれだけのエフェメラルストレージが含まれていますか?
  • 永続/ワークスペースストレージは利用可能ですか?月間GBあたりの価格はいくらですか?
  • スナップショットやテンプレートのストレージ料金はありますか?

エグレス

  • アウトバウンドネットワークエグレスは課金されますか?レートはいくらですか?
  • 無料のエグレス層はありますか?

アイドル時間

  • 自動一時停止はサポートされていますか?何がトリガーになりますか?
  • 一時停止状態からの再開はどのくらい高速ですか?
  • 一時停止中のサンドボックスは、実行中のものと異なる請求体系ですか?

セッション制限

  • 各プラン層での最大セッション時間はどれくらいですか?
  • セッションが制限を超えるとどうなりますか(正常終了か強制終了)?
  • 各層でどのような同時実行制限が適用されますか?

パッケージキャッシュ

  • テンプレートまたはスナップショットはサポートされていますか?
  • テンプレートビルドはどのように課金されますか?

セルフホスト / BYOC

  • BYOCデプロイメントはサポートされていますか?
  • 対応しているクラウドプロバイダーは(AWS、GCP、Azure)?
  • どのような運用サポートが提供されますか?

料金の安定性

  • 現在のレートは最後にいつ更新されましたか?
  • 使用量コミットメントやボリュームディスカウントは利用可能ですか?

結論

サンドボックスの料金は、秒単位のレート以上のものです。クラウドでAIエージェントを実行する実際のコストは、セッション最低料金、コンピュートの構成可能性、ストレージ保持、エグレス、パッケージキャッシュ、アイドル時間の処理が特定のワークロードプロファイルに対してどのように組み合わさるかによって決まります。

導入前にこれを正しく理解することが重要です。vCPUレートが安く見えるプロバイダーでも、カスタムリソース構成を利用するために月額 $150 のサブスクリプションが必要だったり、セッションごとにメガバイト単位のページデータを取得するブラウザエージェントにエグレス料金がかかったりすると、高額になる可能性があります。逆に、自動一時停止やスナップショットテンプレートを備えたプロバイダーは、表面的なレートが示すよりも、スケールしたときに大幅に低コストになる可能性があります。

このガイドの見積もりと質問フレームワークを出発点として使用してください。実際のセッション時間、vCPU/メモリプロファイル、セッション頻度、予想されるストレージ増加量を入力し、各プロバイダーの現在の料金ページ(マーケティングの要約ではなく)と比較してください。この市場のサンドボックス料金は活発に変化しており、現在適用されている数値が6か月後も適用されるとは限りません。

すでにE2BのSDKに精通しているチームには、Novita Agent Sandbox が評価に値します。同じE2B互換インターフェースを使用し、月額サブスクリプション不要で秒単位の課金を行い、VPCやコンプライアンスの制約があるチーム向けにBYOCデプロイメントをサポートしています。ワークロードに適合するかどうかは、上記の変数によって異なります。

FAQ

AIエージェントサンドボックスを大規模に実行する最も安価な方法は何ですか?

最も低い総コストはワークロードの混合によります。高頻度の短いセッションでは、セッションあたりのオーバーヘッドを最小限に抑え、テンプレートを使用してパッケージインストール時間の支払いを回避します。LLM待機ギャップのある長時間実行セッションでは、自動一時停止によりアイドルコンピュートの課金が大幅に削減されます。ユースケースに合った特定のvCPU、メモリ、セッション時間のプロファイルでプロバイダーを比較してください。表面的なレートは、それらの変数を入力しなければ実際のコストを反映しません。

セルフホストは常にマネージドサンドボックスサービスよりも安いですか?

そうとは限りません。セルフホストインフラストラクチャは、単位コンピュートあたりのコストは低くなりますが、プロビジョニング、スケーリング、パッチ適用、可観測性、コンプライアンス作業など、実際の運用オーバーヘッドが追加されます。専任のプラットフォームエンジニアリング能力がないチームの場合、運用コストがマネージドサービスと比較したインフラストラクチャの節約額を上回ることがよくあります。クラウド請求書だけでなく、総所有コストを評価してください。

パッケージキャッシュはサンドボックスの料金にどのように影響しますか?

キャッシュがない場合、サンドボックスを起動するたびにパッケージインストール時間がコンピュートとして課金されます。一般的なデータサイエンスやMLライブラリをインストールするPythonワークロードの場合、インストールにセッションあたり2~5分のコンピュート課金が追加される可能性があります。テンプレートまたはスナップショットを使用すると、パッケージインストールに対して一度支払い、その環境を多くのセッションで再利用できます。一貫したパッケージセットに対して1日あたり数百セッション以上を実行するワークロードでは、通常、テンプレートはすぐに元が取れます。

サンドボックスワークロードのエグレス料金で注意すべき点は何ですか?

ブラウザ自動化、データ取り込みエージェント、および大容量ファイル(データセット、モデルウェイト、外部レジストリからのパッケージ)をダウンロードするワークロードは、significant なアウトバウンドデータ転送を生成する可能性があります。これらのワークロードを拡張する前に、サンドボックスプロバイダーがエグレスに課金するかどうか、またそのレートを明確にしてください。場合によっては、同じクラウドプロバイダー内のパッケージミラー、プレビルドテンプレート、またはリージョナルデータソースを使用することで、エグレス料金を大幅に削減できます。

LLM応答が遅いエージェントのアイドル時間コストを評価するにはどうすればよいですか?

ワークロードにおけるLLM待機時間とアクティブ実行時間の比率を見積もってください。エージェントが2秒のコード実行ステップの間にLLM応答を10秒待つ場合、セッション時間の約83%がアイドル状態です。アクティブなコンピュートのみを課金する自動一時停止を備えたプロバイダーは、そのコストのほとんどを節約します。一時停止/再開のレイテンシをワークロードの許容範囲と比較してください。ユーザーが結果を対話的に待っている場合、再開が遅いと顕著な遅延が発生します。

おすすめ記事