AI 代理人沙箱定價模式:按次計費、運算、儲存與傳輸

AI 代理人沙箱定價模式:按次計費、運算、儲存與傳輸

在您選擇 AI 代理人沙箱平台之前,請先了解其定價模式如何符合您的實際工作負載。沙箱成本不僅僅是運算費率,而是由按次計費、資源層級、儲存、傳輸、套件快取行為以及閒置時間處理方式共同組成。只要其中一個面向估算錯誤,您對真實程式碼代理人或瀏覽器自動化工作流程的成本預估,可能就會相差一個數量級。

本指南將拆解每個定價面向,說明它們在常見工作負載中如何互動,並提供一個比較框架,讓您在註冊前就能評估各廠商在成本上的差異。

沙箱定價的實際運作方式

大多數託管式沙箱供應商會根據以下組合來收費:

  • 運算時間: 沙箱運行期間每秒(或每分鐘)所消耗的 CPU 與 RAM
  • 按次開銷: 每次沙箱啟動的固定費用,或即使短時間運行也會適用的最低計費單位
  • 儲存空間: 超過免費額度後持續佔用的磁碟空間
  • 資料傳出: 對外數據傳輸,通常以 GB 計量
  • 訂閱層級: 每月最低消費,用以解鎖更高的並發數、更長的會話時間或自訂資源配置

沒有供應商會從符合自動暫停條件的閒置沙箱中獲利,但並非所有供應商都以相同方式實作自動暫停。計費模式的邊緣案例與標題費率同等重要。

按次計費

部分供應商會針對每次啟動的沙箱收取固定費用,無論其運行時間長短或資源使用多寡。其他供應商則僅按運算時間計費,無按次開銷。

當您有高頻率、短時間的工作負載時,按次計費的影響最大,例如一個每次使用者對話都會建立並銷毀沙箱的程式碼直譯器。如果每次會話的成本為 0.001 美元,而您的應用程式每天運行 10,000 次會話,那麼在計算任何運算費用之前,每天的按次費用就已達到 10 美元。

該問什麼: 供應商是否收取最低按次費用,還是僅按實際運算時間計費?最低計費單位為何(每秒、每分鐘、每 5 分鐘)?

對於 Novita Agent Sandbox,計費是根據實際 vCPU 和記憶體用量按秒計算,且無額外的按次啟動費用。2026 年中期的定價:1 vCPU 為 0.0000098 美元/秒,記憶體為 0.0000016 美元/GiB/s。一個使用 1 vCPU + 512 MiB RAM 的 5 分鐘短任務,總成本約為 0.0032 美元。(資料來源:Novita AI 定價頁面,經 Novita 已發布文件驗證)

對於 E2B Pro(根據 Novita 已發布的比較文章所述),1 vCPU 的價格為 0.0000140 美元/秒,記憶體為 0.0000045 美元/GiB/s,此外還需要每月 150 美元訂閱才能使用自訂 CPU/RAM 配置與 24 小時的會話長度。

在決定之前,請務必在每個供應商的定價頁面上驗證當前費率——這個市場的沙箱定價正在積極變動中。

運算層級:vCPU 與記憶體

對於大多數沙箱工作負載來說,運算成本是主要開銷。其變數包括:

  • vCPU 數量: 大多數供應商按 vCPU 線性計費
  • 記憶體: 按 GiB/秒計費,費率通常低於運算成本
  • 可配置性: 部分供應商提供固定層級(例如 1/2/4/8 vCPU),其他則允許任意分配

對於批次代理人工作負載(同時執行許多短任務),記憶體與 vCPU 的比例至關重要。一個載入大型 CSV 檔案的數據分析任務可能需要 4 GiB RAM,但僅需 1 vCPU。如果您只需 1 vCPU + 4 GiB 卻為固定的 4 vCPU + 4 GiB 層級付費,那麼每個任務就會浪費三個 CPU 的計費時間。

該問什麼: 我可以獨立配置 vCPU 和記憶體嗎?是否有最低分配量?如果我需要在沙箱內進行模型推論,有哪些 GPU 層級可用?

實際影響:對於運行混合工作負載(部分 CPU 密集、部分記憶體密集)的團隊來說,採用靈活按資源計費的供應商,比採用固定運算套裝方案的供應商更能有效控制成本。

儲存:暫存 vs. 持久化

沙箱儲存有兩種形式,其計費行為也不同:

暫存儲存 是沙箱在會話期間的本機檔案系統。沙箱終止時,資料就會消失。大多數供應商都包含免費配額(通常為 10–20 GB),且在該限制內不會額外收費。

持久化儲存 則能跨會話保存資料。代理人會在此儲存檢查點、生成的檔案、快取工件或下一次需要使用的工作區狀態。持久化磁碟通常按每月每 GB 計費,類似於雲端區塊儲存定價。

常見的成本陷阱:如果您的代理人產生大型中間檔案(日誌、模型輸出、原始數據),而這些檔案在沒有清理的情況下累積在持久化儲存中,儲存費用會隨著時間疊加。一個每天產生 1 GB 輸出並將所有內容保留 30 天的代理人,在您察覺之前就會累積 30 GB 的儲存空間。

該問什麼: 每個沙箱的免費暫存儲存配額是多少?是否有持久化/工作區儲存可用?價格如何?沙箱磁碟是否有大小上限?是否有快照或範本儲存費用?

Novita Agent Sandbox 包含 20 GB 的免費沙箱儲存空間。超出免費額度的持久化儲存定價應在當前定價頁面上確認。

傳輸與網路費用

傳輸費用經常讓開發者感到意外,因為它們在開發階段不易察覺,但在生產規模下卻會顯著增加。

大多數託管雲端供應商會針對以下項目收費:

  • 從沙箱到公共網際網路的對外數據傳輸
  • 跨區域數據傳輸(如果您的沙箱區域與應用程式伺服器不同)
  • 沙箱內的大型檔案下載(例如下載數據集、模型權重、npm 套件)

會拉取外部數據的沙箱工作負載——例如擷取頁面的瀏覽器自動化代理人、下載數據集的數據代理人、複製儲存庫的程式碼代理人——在規模化後會產生可觀的傳輸量。一個每次會話都複製 500 MB 儲存庫、每天運行 1,000 次會話的程式碼代理人,每天會產生 500 GB 的傳輸量。

該問什麼: 供應商是否收取對外傳輸費用?費率為何?傳入數據(上傳至沙箱)是否也要收費?較低的方案層級是否有傳輸上限或頻寬限制?

許多沙箱供應商並未公布明確的傳輸定價,而是將其納入平台範圍的網路成本摘要中。在規模化之前,請務必釐清。

套件快取的經濟效益

每次都在沙箱內安裝 Python 套件、npm 相依套件或系統套件,不僅耗時,成本也很高。全新執行 pip install torch 可能需要數分鐘,並為每次會話增加可觀的運算費用。

不同供應商對此有不同的處理方式:

無快取: 每個沙箱都從基礎映像檔啟動,並每次都從頭安裝套件。啟動延遲較高;運算費用包含安裝時間。

範本/快照快取: 您建立一個預先安裝好套件的沙箱範本。會話從該快照啟動。啟動速度快;套件安裝的運算費用只在建立範本時支付一次,而非每次會話。

隱式層級快取: 部分供應商會自動快取相同映像檔沙箱之間的套件層,類似 Docker 層級快取。因此,常用套件會從快取中拉取,而非重新下載。

其中的經濟效益:如果一個 5 分鐘的代理人任務每次運行需要 2 分鐘的套件安裝時間,那麼您有 40% 的運算費用是花在設定上,而非實際工作。範本或快照能消除這項開銷,但代價是範本儲存和管理上的複雜性。

該問什麼: 供應商是否支援沙箱範本或快照?範本是按範本計費,還是僅在從範本啟動會話時計費?範本映像檔需要多久重建一次(例如當基礎套件更新時)?

Novita Agent Sandbox 支援用於預建環境的範本。對於針對一組一致套件運行高頻任務的團隊,應評估範本儲存成本與每次會話的套件安裝時間節省之間的取捨——對於大多數工作負載來說,範本很快就能回本。

閒置時間與自動暫停

在代理人步驟之間處於閒置狀態的沙箱會浪費金錢。如果代理人在等待 LLM 回應時暫停了 30 秒,而沙箱仍在運行,則運算費用仍在計算中。

自動暫停 / 自動恢復(有時稱為暫停/恢復或閒置快照)指的是在沒有程式碼執行時凍結沙箱,並僅在活躍時才計算運算費用。對於 LLM 等待間隔較長的工作流程來說,這可以大幅降低成本——例如一個多輪程式碼代理人,LLM 需要 10 秒來生成每個程式碼片段,而沙箱在這 10 秒內處於閒置狀態。

該問什麼: 供應商是否支援自動暫停?觸發暫停的條件是什麼(閒置時間閾值、明確的 API 呼叫)?恢復速度有多快——低於 1 秒,還是接近完整的冷啟動?暫停中的沙箱與運行中的沙箱計費方式是否不同?

取捨在於:恢復速度慢的自動暫停會為每個代理人步驟增加延遲。對於對延遲敏感的互動式工作負載,保持沙箱運作(並支付閒置時間費用)可能是正確的選擇。對於在夜間運行的批次工作負載,自動暫停幾乎總是值得的。

自託管:隱藏的成本模式

自託管或自帶雲端 (BYOC) 沙箱部署的成本結構與託管雲端服務有本質上的不同。其單位運算的基礎設施帳單較低,但營運管理成本是真實存在的。

自託管需要支付的項目:

  • VM 或裸機成本(通常按雲端競價/預留執行個體費率計算,低於託管沙箱費率)
  • 儲存:EBS/持久化磁碟、快照儲存,以及從您雲端帳戶產生的對外傳輸費用
  • 運維工程時間:佈建、擴展、修補、安全強化與事件回應
  • 可觀測性基礎設施:沙箱生命週期事件的日誌、指標、追蹤
  • 合規工作:如果您需要 SOC 2、HIPAA 或類似控制項,這些工作需由您的團隊負責

常見的錯誤是將自託管的運算費率與託管沙箱費率相比,然後得出自託管選項更便宜的結論。運維和合規的管理成本通常會超過基礎設施節省的費用,特別是對於無法投入至少三名平台工程師來全職維護沙箱基礎設施的團隊而言。

自託管適用於以下情況:

  • 團隊已有現有的雲端基礎設施和平台工程能力
  • 法規環境要求數據不得離開特定的雲端帳戶或區域
  • 極高吞吐量的工作負載,其大規模運作下自託管與託管之間的成本差距超過了運維管理成本

Novita Agent Sandbox 支援將 BYOC 部署到 AWS 或 GCP 帳戶,適合因合規性或網路政策而需要沙箱在其自有 VPC 內運行的團隊。E2B 目前並未記載 BYOC 是標準 Pro 方案的可用選項,不過這可能會有變化——請在您評估時向各供應商確認。

三種常見工作負載的成本估算

這些估算以 Novita 已發布的定價作為參考基準。請根據您工作負載的實際 vCPU、記憶體、會話長度和每日會話次數來調整估算值。在將這些數字用於預算規劃之前,請務必確認當前費率。

工作負載 1:程式碼代理人(互動式、短會話)

  • 設定:1 vCPU、1 GiB RAM、平均 10 分鐘會話、每天 500 次會話
  • 運算費用:(0.0000098 × 600 秒) + (0.0000016 × 1 × 600 秒) = 0.00588 美元 + 0.00096 美元 = 每次會話約 0.007 美元
  • 每日費用:約 3.50 美元/天,每天 500 次會話下約 105 美元/月
  • 關鍵變數:套件快取——如果沒有範本,每次會話需額外增加 2–3 分鐘的安裝時間

工作負載 2:數據分析代理人(中等會話、較大記憶體)

  • 設定:2 vCPU、4 GiB RAM、平均 30 分鐘會話、每天 100 次會話
  • 運算費用:(0.0000196 × 1800 秒) + (0.0000016 × 4 × 1800 秒) = 0.03528 美元 + 0.01152 美元 = 每次會話約 0.047 美元
  • 每日費用:約 4.70 美元/天,每天 100 次會話下約 141 美元/月
  • 關鍵變數:輸出檔案保留——如果每次會話產生 100 MB 的儲存輸出,每天 100 次會話 = 每天 10 GB 的儲存累積

工作負載 3:瀏覽器自動化代理人(長會話、網路密集型)

  • 設定:2 vCPU、2 GiB RAM、平均 60 分鐘會話、每天 50 次會話
  • 運算費用:(0.0000196 × 3600 秒) + (0.0000016 × 2 × 3600 秒) = 0.07056 美元 + 0.01152 美元 = 每次會話約 0.082 美元
  • 每日費用:約 4.10 美元/天,每天 50 次會話下約 123 美元/月
  • 關鍵變數:傳輸費用——瀏覽器代理人每次會話擷取 10 MB 頁面數據 × 50 次會話 = 每天可能產生 500 MB 的傳輸費用

這些估算未包含訂閱費、傳輸費和持久化儲存費用。對於有每月最低訂閱要求的供應商,請在比較前加上該固定成本。

應向任何沙箱供應商提出的問題

在評估沙箱供應商的成本時,請使用此清單:

計費模式

  • 計費單位是每秒、每分鐘還是更大的單位?
  • 是否有每次會話的最低費用或啟動費用?
  • 是否需要每月訂閱才能使用自訂資源配置或長時間會話?

運算

  • vCPU 和記憶體可以獨立配置嗎?
  • vCPU/記憶體的最小和最大分配量為何?
  • 是否有配備 GPU 的沙箱可用?如何計費?

儲存

  • 每個沙箱包含多少暫存儲存空間?
  • 是否有持久化/工作區儲存可用?每 GB/月的價格為何?
  • 是否有快照或範本儲存費用?

傳輸

  • 對外網路傳輸是否收費?費率為何?
  • 是否有免費的傳輸額度?

閒置時間

  • 是否支援自動暫停?觸發條件為何?
  • 從暫停狀態恢復的速度有多快?
  • 暫停中的沙箱與運行中的沙箱計費方式是否不同?

會話限制

  • 每個方案層級的會話最大持續時間為何?
  • 當會話超過限制時會發生什麼事——正常終止還是強制中斷?
  • 每個層級適用的並發限制為何?

套件快取

  • 是否支援範本或快照?
  • 範本建置如何計費?

自託管 / BYOC

  • 是否支援 BYOC 部署?
  • 支援哪些雲端供應商(AWS、GCP、Azure)?
  • 提供哪些營運支援?

定價穩定性

  • 當前費率上次更新是何時?
  • 是否有承諾用量或大量使用的折扣?

結論

沙箱定價不僅僅是每秒費率。在雲端中運行 AI 代理人的實際成本,取決於每次會話最低費用、運算可配置性、儲存保留、傳輸、套件快取以及閒置時間處理方式,如何針對您的特定工作負載設定組合在一起。

在您做出決定之前,正確評估這一點至關重要。一個在 vCPU 費率上看起來便宜的供應商,在加上每月 150 美元的訂閱費用(用以解鎖自訂資源配置)或瀏覽器代理人每次會話擷取數 MB 頁面數據所產生的傳輸費用後,可能會變得很昂貴。相反地,一個提供自動暫停和快照範本的供應商,在大規模使用下的成本可能遠低於其標題費率所暗示的數字。

請使用本指南中的估算和問題框架作為起點。代入您的實際會話長度、vCPU/記憶體設定、會話頻率以及預期的儲存增長,然後將其與每個供應商當前定價頁面上的資訊進行比較,而非行銷摘要。這個市場的沙箱定價正在積極變動,今天適用的數字六個月後可能不再適用。

對於已經熟悉 E2B SDK 的團隊,Novita Agent Sandbox 值得評估:它使用相同的 E2B 相容介面,按秒計費且無需每月訂閱,並為有 VPC 或合規需求的團隊提供 BYOC 部署支援。它是否適合您的工作負載,則取決於上述的變數。

常見問題

大規模運行 AI 代理人沙箱最便宜的方式是什麼?

最低總成本取決於您的工作負載組合。對於高頻率的短會話,應盡量減少每次會話的開銷,並使用範本避免支付套件安裝時間的費用。對於 LLM 等待間隔較長的長時間會話,自動暫停可顯著減少閒置運算費用。請根據符合您使用案例的特定 vCPU、記憶體和會話持續時間設定來比較供應商——如果不代入這些變數,標題費率並不能反映您的實際成本。

自託管是否一定比託管沙箱服務便宜?

不一定。自託管基礎設施的單位運算成本較低,但會增加實際的營運管理成本:佈建、擴展、修補、可觀測性和合規工作。對於沒有專用平台工程能力的團隊來說,與託管服務相比,營運成本常常超過基礎設施節省的費用。請評估總體擁有成本,而不僅僅是雲端帳單。

套件快取如何影響沙箱定價?

如果沒有快取,每次沙箱啟動都包含套件安裝時間,這部分會以運算費用計費。對於安裝常見數據科學或 ML 函式庫的 Python 工作負載,安裝時間每次會話可能增加 2–5 分鐘的運算費用。範本或快照可讓您只支付一次套件安裝費用,然後在多次會話中重複使用該環境。對於任何每天針對一組一致套件運行數百次以上會話的工作負載,範本通常很快就能回本。

在沙箱工作負載中,我應該注意哪些傳輸定價問題?

瀏覽器自動化、數據攝取代理人以及需要下載大型檔案(數據集、模型權重、來自外部註冊表的套件)的工作負載,可能會產生大量對外數據傳輸。在擴展這些工作負載之前,請務必釐清您的沙箱供應商是否收取傳輸費用以及費率為何。在某些情況下,使用套件鏡像站、預建範本或同一雲端供應商內的區域數據來源,可以大幅降低傳輸費用。

對於 LLM 回應速度較慢的代理人,如何評估閒置時間成本?

估算您工作負載中 LLM 等待時間與活躍執行時間的比例。如果一個代理人在每次 2 秒的程式碼執行步驟之間等待 LLM 回應 10 秒,那麼大約有 83% 的會話時間是閒置的。一個具有自動暫停功能、僅對活躍運算計費的供應商可以節省大部分成本。請將暫停/恢復延遲與您工作負載的容忍度進行比較——如果使用者正在互動式地等待結果,緩慢的恢復會增加明顯的延遲。

推薦文章