在你选择 AI Agent 沙箱平台之前,先了解其定价模式是否适合你的实际工作负载。沙箱成本不仅仅是计算费率——它们包括会话费用、资源分层、存储、出站流量、包缓存行为和空闲时间处理。任何一个维度搞错,你的真实编码 Agent 或浏览器自动化工作流成本估算就可能相差一个数量级。
本指南将拆解每个定价维度,展示它们在常见工作负载中的交互方式,并为你提供一个评估框架,以便在注册之前比较不同供应商的成本。
沙箱定价的实际运作方式
大多数托管沙箱供应商按照以下某种组合收费:
- 计算时间: 沙箱运行期间每秒(或每分钟)消耗的 CPU 和 RAM
- 会话开销: 每次启动的固定会话费用,或者即使运行时间很短也要计费的最小计费单位
- 存储: 超出免费层级的持久卷空间
- 出站流量: 出站数据传输,通常以 GB 为单位
- 订阅层级: 每月的消费门槛,解锁更高的并发、更长的会话时长或自定义资源配置
没有供应商会从符合自动暂停条件的空闲沙箱中盈利——但并非所有供应商都以相同方式实现自动暂停。计费模型的边缘情况与标价一样重要。
按会话收费
一些供应商对每个启动的沙箱收取固定费用,无论其运行时长或资源使用量。其他供应商仅按计算时间计费,无会话开销。
当你有高频、短时的工作负载时,按会话收费影响最大——例如,一个代码解释器在每次用户聊天轮次中创建并销毁一个沙箱。如果启动一个会话花费 $0.001,而你的应用程序每天运行 10,000 个会话,那么在计入任何计算成本之前,每天的会话费用就达到 $10。
需要询问的问题: 供应商是否收取最低会话费用,还是仅按实际计算时间计费?最小计费单位是多少(每秒、每分钟、每 5 分钟)?
对于 Novita Agent Sandbox,计费基于实际的 vCPU 和内存使用量,按秒计费,无额外的会话启动费。截至 2026 年中期的定价:1 vCPU 为 $0.0000098/s,内存为 $0.0000016/GiB/s。一个 5 分钟的短任务,使用 1 vCPU + 512 MiB RAM,总成本约为 $0.0032。(来源:Novita AI 定价页面,已在 Novita 发布的文档中验证。)
对于 E2B Pro(如 Novita 发布的对比文章所述),1 vCPU 定价为 $0.0000140/s,内存为 $0.0000045/GiB/s,另外还需要每月 $150 的订阅才能访问自定义 CPU/RAM 配置和 24 小时会话时长。
在投入之前,务必在这些供应商的定价页面核实当前费率——这个市场的沙箱定价正在积极变化。
计算分层:vCPU 和内存
计算是大多数沙箱工作负载的主要成本。变量包括:
- vCPU 数量: 大多数供应商按每个 vCPU 线性计费
- 内存: 按 GiB/s 计费,通常费率低于计算
- 可配置性: 一些供应商提供固定组合(例如 1/2/4/8 vCPU),其他供应商允许任意分配
对于批量 Agent 工作负载(并行运行多个短任务),内存与 vCPU 的比例很重要。一个需要加载大型 CSV 的数据分析任务可能需要 4 GiB RAM 但只需要 1 vCPU。如果你只需要 1 vCPU + 4 GiB,却为固定组合 4 vCPU + 4 GiB 付费,则每个任务会浪费三个 CPU 的计费时间。
需要询问的问题: 我可以独立配置 vCPU 和内存吗?是否有最低分配?如果我需要在沙箱内进行模型推理,哪些 GPU 层级可用?
实际意义:一个具有灵活按资源计费的供应商,可以让运行混合工作负载(有些 CPU 密集、有些内存密集)的团队比使用固定计算包的供应商获得更好的成本控制。
存储:临时存储 vs. 持久存储
沙箱存储有两种具有不同计费行为的形式:
临时存储 是会话期间沙箱的本地文件系统。会话终止时它消失。大多数供应商会提供一个免费分配(通常 10–20 GB),并在该限制内不额外收费。
持久存储 在会话之间持久存在。Agent 在这里存储检查点、生成的文件、缓存工件或需要在下一次会话中可用的工作区状态。持久卷通常按每月每 GB 计费,类似于云块存储定价。
成本陷阱:如果你的 Agent 生成大量中间文件(日志、模型输出、原始数据),并且这些文件在持久存储中累积而不清理,存储费用会随时间叠加。一个 Agent 每天生成 1 GB 输出并保留所有内容 30 天,在你注意到之前累积了 30 GB 存储。
需要询问的问题: 每个沙箱的免费临时存储分配是多少?持久/工作区存储是否可用?价格如何?沙箱磁盘是否有最大大小?有没有快照或模板存储费用?
Novita Agent Sandbox 包含 20 GB 的免费沙箱存储。超出免费层级的持久存储定价应在当前定价页面上确认。
出站流量和网络费用
出站流量费用让开发者措手不及,因为在开发时不可见,但在生产规模中变得重要。
大多数托管云供应商对以下项收费:
- 从沙箱到公共互联网的出站数据传输
- 跨区域数据传输(如果你的沙箱区域与应用服务器区域不同)
- 沙箱内的大文件下载(例如下载数据集、模型权重、npm 包)
沙箱工作负载拉取外部数据——浏览器自动化 Agent 抓取页面、数据 Agent 下载数据集、编码 Agent 克隆仓库——在规模下可能产生大量出站流量。一个编码 Agent 在每个会话中克隆一个 500 MB 的仓库,每天运行 1,000 个会话,每天传输 500 GB 的出站流量。
需要询问的问题: 供应商是否对出站流量收费?费率是多少?入站数据(上传到沙箱)是否也收费?较低计划层级是否有出站上限或限流?
许多沙箱供应商不公布明确的出站流量定价,而是将其包含在平台范围的网络成本汇总中。在扩展之前获取明确答案。
包缓存经济性
每次在沙箱内安装 Python 包、npm 依赖或系统包,不仅消耗时间,还消耗成本。每次运行都执行 pip install torch 可能需要几分钟,并给每个会话增加大量计算费用。
供应商处理方式不同:
无缓存: 每个沙箱从基础镜像启动,每次从头安装包。启动延迟高;计算计费包括安装时间。
模板/快照缓存: 你创建一个预构建的沙箱模板,其中包含已安装的包。会话从该快照启动。启动速度快;包安装的计算成本在构建模板时支付一次,而不是每次会话。
隐式层缓存: 一些供应商在不同沙箱中自动缓存包层,类似于 Docker 层缓存,这样常用包从缓存拉取而不是重新下载。
经济性:如果一个 5 分钟的 Agent 任务需要 2 分钟的包安装时间,那么你 40% 的计算费用用于设置而不是工作。模板或快照消除了这种开销,但代价是模板存储和管理复杂度。
需要询问的问题: 供应商是否支持沙箱模板或快照?模板是按每个模板计费还是仅在会话启动时计费?模板镜像需要多久重建一次(例如基础包更新时)?
Novita Agent Sandbox 支持用于预构建环境的模板。运行高频任务且使用一致包集合的团队应评估模板存储成本与按会话包安装时间节省之间的关系——对于大多数工作负载,模板能快速回本。
空闲时间和自动暂停
Agent 步骤之间空闲的沙箱浪费金钱。一个 Agent 在等待 LLM 响应时暂停 30 秒,如果沙箱仍在运行,则仍消耗计算计费。
自动暂停/自动恢复(有时称为暂停/恢复或空闲时快照)意味着在没有代码执行时冻结沙箱,并且仅在活跃时计费计算时间。这可以显著降低具有较长 LLM 等待间隙的工作流成本——例如,在一个多轮编码 Agent 中,LLM 每生成一个代码片段需要 10 秒,而沙箱在这 10 秒内空闲。
需要询问的问题: 供应商是否支持自动暂停?触发暂停的条件是什么(空闲时间阈值、明确的 API 调用)?恢复速度多快——低于 1 秒,还是接近完整冷启动?暂停的沙箱和运行的沙箱在计费上是否有区别?
权衡:自动暂停加上慢速恢复会增加每个 Agent 步骤的延迟。对于延迟敏感的交互式工作负载,保持沙箱 warm(并支付空闲时间)可能是正确的选择。对于过夜运行的批处理工作负载,自动暂停几乎总是值得的。
自托管:隐藏的成本模型
自托管或自带云(BYOC)沙箱部署与托管云服务具有根本不同的成本结构。基础设施账单在计算单位上更低,但运营开销是真实的。
自托管你需要支付:
- VM 或裸金属成本(通常使用云竞价/预留费率,低于托管沙箱费率)
- 存储:EBS/持久卷、快照存储以及从你的云帐户流出的出站流量
- 运维工程时间:配置、扩展、打补丁、安全加固和事件响应
- 可观测性基础设施:用于沙箱生命周期事件的日志、指标、追踪
- 合规工作:如果你需要 SOC 2、HIPAA 或类似控制,工作落在你的团队身上
常见的错误是将自托管计算率与托管沙箱率进行比较,并认为自托管选项更便宜。运营和合规开销通常超过基础设施节省,尤其是对于少于三名平台工程师全职负责沙箱基础设施的团队。
自托管适用的场景:
- 已有云基础设施和平台工程能力的团队
- 数据不能离开特定云帐户或区域的监管环境
- 极高容量工作负载,其托管与自托管的大规模成本差异超过运营开销
Novita Agent Sandbox 支持将 BYOC 部署到 AWS 或 GCP 帐户,适用于需要在其自身 VPC 内运行沙箱以符合合规或网络策略要求的团队。E2B 目前未将 BYOC 作为标准 Pro 计划的选项记录在案,但这可能会改变——评估时与每个供应商确认。
三种常见工作负载的成本估算
这些估算使用 Novita 已公布的定价作为参考点。根据你工作负载的实际 vCPU、内存、会话长度和每天会话数调整估算。在将这些数字用于预算规划之前,务必验证当前费率。
工作负载 1:编码 Agent(交互式、短会话)
- 配置:1 vCPU,1 GiB RAM,平均 10 分钟会话,每天 500 个会话
- 计算:(0.0000098 × 600s) + (0.0000016 × 1 × 600s) = $0.00588 + $0.00096 = 约 $0.007 每会话
- 每天:约 $3.50/天,每天 500 会话约 $105/月
- 关键变量:包缓存——没有模板的话,每次会话多 2–3 分钟的安装时间
工作负载 2:数据分析 Agent(中等会话、更大内存)
- 配置:2 vCPU,4 GiB RAM,平均 30 分钟会话,每天 100 个会话
- 计算:(0.0000196 × 1800s) + (0.0000016 × 4 × 1800s) = $0.03528 + $0.01152 = 约 $0.047 每会话
- 每天:约 $4.70/天,每天 100 会话约 $141/月
- 关键变量:输出文件保留——如果每个会话生成 100 MB 存储输出,每天 100 个会话 = 每天累积 10 GB 存储
工作负载 3:浏览器自动化 Agent(长会话、网络密集)
- 配置:2 vCPU,2 GiB RAM,平均 60 分钟会话,每天 50 个会话
- 计算:(0.0000196 × 3600s) + (0.0000016 × 2 × 3600s) = $0.07056 + $0.01152 = 约 $0.082 每会话
- 每天:约 $4.10/天,每天 50 会话约 $123/月
- 关键变量:出站流量——浏览器 Agent 每个会话获取 10 MB 页面数据 × 50 个会话 = 每天可能产生 500 MB 出站流量费用
这些估算不包括订阅费、出站流量和持久存储。对于有月度订阅最低消费的供应商,在比较之前加入该固定成本。
向任何沙箱供应商提问的问题
在评估沙箱供应商成本时使用这份清单:
计费模型
- 计费单位是每秒、每分钟还是更大的单位?
- 是否有按会话的最低费用或启动费?
- 是否需要月度订阅才能访问自定义资源配置或长会话?
计算
- vCPU 和内存可以独立配置吗?
- 最小和最大 vCPU/内存分配是多少?
- 是否有支持 GPU 的沙箱?如何计费?
存储
- 每个沙箱包含多少临时存储?
- 是否有持久/工作区存储?每月每 GB 价格多少?
- 是否有快照或模板存储费用?
出站流量
- 是否对出站网络流量收费?费率多少?
- 是否有免费出站流量层级?
空闲时间
- 是否支持自动暂停?触发条件是什么?
- 从暂停状态恢复的速度如何?
- 暂停的沙箱与运行中的沙箱计费方式是否不同?
会话限制
- 每个计划层级的最大会话时长是多少?
- 当会话超过限制时会发生什么——优雅终止还是硬杀?
- 每个层级适用的并发限制是多少?
包缓存
- 是否支持模板或快照?
- 模板构建如何计费?
自托管 / BYOC
- 是否支持 BYOC 部署?
- 支持哪些云提供商(AWS、GCP、Azure)?
- 提供哪些运维支持?
定价稳定性
- 当前费率上次更新是什么时候?
- 是否有承诺用量或批量折扣?
结论
沙箱定价不仅仅是每秒费率。在云端运行 AI Agent 的真实成本取决于会话最低费用、计算可配置性、存储保留、出站流量、包缓存和空闲时间处理如何针对你的特定工作负载配置组合。
在投入之前正确理解这一点至关重要。一个在 vCPU 费率上看起来很便宜的供应商,如果加上每月 $150 的订阅才能解锁自定义资源配置,或者浏览器 Agent 每次会话获取数 MB 页面数据带来的出站流量费用,可能变得昂贵。相反,具有自动暂停和快照模板的供应商在实际规模下的成本可能远低于标价。
使用本指南中的估算和问题框架作为起点。代入你实际的会话长度、vCPU/内存配置、会话频率和预期存储增长——然后与每个供应商的当前定价页面(而非营销摘要)进行比较。这个市场的沙箱定价正在积极变化,今天适用的数字可能在六个月后不再适用。
对于已经熟悉 E2B SDK 的团队,Novita Agent Sandbox 值得评估:它使用相同的 E2B 兼容接口,按秒计费,无需月度订阅,并支持需要 VPC 或合规约束的团队的 BYOC 部署。是否适合你的工作负载取决于上述变量。
常见问题
以规模运行 AI Agent 沙箱最便宜的方式是什么?
最低总成本取决于你的工作负载组合。对于高频短会话,尽量减少每会话的开销,并使用模板避免支付包安装时间。对于带有 LLM 等待间隙的长运行会话,自动暂停显著降低空闲计算费用。根据你的具体 vCPU、内存和会话时长配置比较供应商——标价不反映实际成本,除非代入这些变量。
自托管总是比托管沙箱服务便宜吗?
不一定。自托管基础设施的单位计算成本较低,但增加了实际的运营开销:配置、扩展、打补丁、可观测性和合规工作。对于没有专门平台工程能力的团队,运营成本通常超过与托管服务相比的基础设施节省。评估总拥有成本,而不仅仅是云账单。
包缓存如何影响沙箱定价?
没有缓存时,每次沙箱启动都包括包安装时间,并作为计算计费。对于安装常见数据科学或机器学习库的 Python 工作负载,安装可能每个会话增加 2–5 分钟的计算费用。模板或快照让你一次性支付包安装费用,并在多个会话中重用该环境。对于任何每天运行数百个会话且使用一致包集合的工作负载,模板通常能快速回本。
沙箱工作负载中,出站流量定价需要注意什么?
浏览器自动化、数据摄取 Agent 以及下载大文件(数据集、模型权重、外部仓库的包)的工作负载可能产生大量出站数据传输。在扩展这些工作负载之前,明确你的沙箱供应商是否对出站流量收费以及费率多少。在某些情况下,使用包镜像、预烘焙模板或同一云供应商内的区域数据源可以显著降低出站流量费用。
如何评估具有慢 LLM 响应的 Agent 的空闲时间成本?
估算工作负载中 LLM 等待时间与活动执行时间的比例。如果一个 Agent 在每次 2 秒代码执行步骤之间等待 LLM 响应 10 秒,那么大约 83% 的会话时间是空闲的。具有自动暂停且仅对活动计算计费的供应商可以节省大部分成本。将暂停/恢复延迟与你工作负载的容忍度进行比较——如果用户交互等待结果,慢速恢复会带来明显延迟。
