- Comment fonctionne réellement la tarification des sandbox
- Frais par session
- Niveaux de calcul : vCPU et mémoire
- Stockage : éphémère vs persistant
- Frais de transfert sortant et réseau
- Économie de la mise en cache des paquets
- Temps d'inactivité et pause automatique
- Auto-hébergé : le modèle de coût caché
- Estimations de coûts pour trois charges de travail courantes
- Questions à poser à tout fournisseur de sandbox
- Conclusion
- FAQ
- Articles recommandés
Avant de vous engager sur une plateforme de sandbox pour agents IA, comprenez comment son modèle de tarification correspond à votre charge de travail réelle. Les coûts d’un sandbox ne se résument pas aux taux de calcul — ils combinent frais de session, niveaux de ressources, stockage, transfert sortant, comportement de mise en cache des paquets et gestion du temps d’inactivité. Si vous vous trompez sur un seul axe, votre estimation des coûts pour un véritable agent de codage ou un workflow d’automatisation de navigateur peut être décalée d’un ordre de grandeur.
Ce guide décompose chaque axe de tarification, montre comment ils interagissent dans les charges de travail courantes et vous donne un cadre de comparaison pour évaluer les fournisseurs sur le coût avant de vous inscrire.
Comment fonctionne réellement la tarification des sandbox
La plupart des fournisseurs de sandbox gérés facturent sur une combinaison de :
- Temps de calcul : CPU et RAM consommés par seconde (ou par minute) pendant que le sandbox est actif
- Frais de session : frais de démarrage forfaitaires par session, ou unité de facturation minimale qui s’applique même pour les exécutions courtes
- Stockage : espace de volume persistant au-delà du niveau gratuit inclus
- Transfert sortant : transfert de données sortant, généralement mesuré en Go
- Niveau d’abonnement : minimum mensuel qui débloque une concurrence plus élevée, des sessions plus longues ou des configurations de ressources personnalisées
Aucun fournisseur ne gagne de l’argent sur les sandbox inactifs éligibles à la pause automatique — mais tous ne mettent pas en œuvre la pause automatique de la même manière. Les cas particuliers du modèle de facturation comptent autant que le taux annoncé.
Frais par session
Certains fournisseurs facturent des frais fixes pour chaque sandbox démarré, indépendamment de sa durée d’exécution ou des ressources utilisées. D’autres facturent uniquement le temps de calcul sans frais de session.
Un frais par session importe surtout lorsque vous avez des charges de travail de courte durée et à haute fréquence — par exemple, un interpréteur de code qui crée et détruit un sandbox pour chaque tour utilisateur dans une session de chat. Si une session coûte 0,001 $ au démarrage et que votre application exécute 10 000 sessions par jour, cela représente 10 $/jour de frais de session avant même de compter le calcul.
Ce qu’il faut demander : Le fournisseur facture-t-il des frais minimums par session, ou seulement pour le temps de calcul réel ? Quelle est l’unité de facturation minimale (par seconde, par minute, toutes les 5 minutes) ?
Pour Novita Agent Sandbox, la facturation est à la seconde en fonction de l’utilisation réelle du vCPU et de la mémoire, sans frais de démarrage supplémentaires par session. Tarifs à mi-2026 : 1 vCPU à 0,0000098 $/s, mémoire à 0,0000016 $/Gio/s. Une tâche courte de 5 minutes sur 1 vCPU + 512 Mio de RAM coûte environ 0,0032 $ au total. (Source : page de tarification Novita AI, vérifiée dans la documentation publiée de Novita.)
Pour E2B Pro (tel que documenté dans les articles de comparaison publiés par Novita), 1 vCPU est facturé à 0,0000140 $/s avec la mémoire à 0,0000045 $/Gio/s, plus un abonnement de 150 $/mois requis pour accéder à la configuration CPU/RAM personnalisée et aux sessions de 24 heures.
Vérifiez toujours les tarifs actuels sur la page de tarification de chaque fournisseur avant de vous engager — la tarification des sandbox évolue activement sur ce marché.
Niveaux de calcul : vCPU et mémoire
Le calcul est le coût dominant pour la plupart des charges de travail en sandbox. Les variables sont :
- Nombre de vCPU : la plupart des fournisseurs facturent linéairement par vCPU
- Mémoire : facturée par Gio/s, généralement à un taux inférieur à celui du calcul
- Configurabilité : certains fournisseurs proposent des niveaux fixes (par exemple, 1/2/4/8 vCPU), d’autres permettent une allocation arbitraire
Pour les charges de travail par lots d’agents — exécutant de nombreuses tâches courtes en parallèle — le ratio mémoire/vCPU est important. Une tâche d’analyse de données qui charge un gros fichier CSV peut nécessiter 4 Gio de RAM mais seulement 1 vCPU. Payer pour un niveau fixe de 4 vCPU + 4 Gio alors que vous n’avez besoin que de 1 vCPU + 4 Gio gaspille trois temps de facturation CPU par tâche.
Ce qu’il faut demander : Puis-je configurer indépendamment le vCPU et la mémoire ? Y a-t-il une allocation minimale ? Quels niveaux de GPU sont disponibles si j’ai besoin d’inférence de modèle à l’intérieur du sandbox ?
L’implication pratique : un fournisseur avec une facturation flexible par ressource donne aux équipes gérant des charges de travail mixtes (certaines intensives en CPU, d’autres en mémoire) un meilleur contrôle des coûts qu’un fournisseur avec des bundles de calcul fixes.
Stockage : éphémère vs persistant
Le stockage du sandbox se présente sous deux formes avec un comportement de facturation différent :
Le stockage éphémère est le système de fichiers local du sandbox pendant une session. Il disparaît lorsque le sandbox se termine. La plupart des fournisseurs incluent une allocation gratuite (10–20 Go est courant) et ne facturent pas de supplément dans cette limite.
Le stockage persistant subsiste entre les sessions. C’est là que les agents stockent les points de contrôle, les fichiers générés, les artefacts mis en cache ou l’état de l’espace de travail qui doit être disponible la prochaine fois. Les volumes persistants sont généralement facturés par Go par mois, à l’instar de la tarification du stockage en bloc cloud.
Le piège des coûts : si votre agent génère des fichiers intermédiaires volumineux (logs, sorties de modèle, données brutes) et que ceux-ci s’accumulent dans le stockage persistant sans nettoyage, les frais de stockage se cumulent avec le temps. Un agent qui génère 1 Go de sortie par jour et conserve tout pendant 30 jours accumule 30 Go de stockage avant que vous ne vous en rendiez compte.
Ce qu’il faut demander : Quelle est l’allocation de stockage éphémère gratuite par sandbox ? Le stockage persistant/espace de travail est-il disponible et comment est-il tarifé ? Y a-t-il une taille maximale de disque du sandbox ? Y a-t-il des frais de stockage pour les instantanés ou les modèles ?
Novita Agent Sandbox inclut 20 Go de stockage sandbox gratuit. La tarification du stockage persistant au-delà du niveau gratuit doit être vérifiée sur la page de tarification actuelle.
Frais de transfert sortant et réseau
Les frais de transfert sortant surprennent les développeurs car ils sont invisibles pendant le développement mais deviennent significatifs à l’échelle de la production.
La plupart des fournisseurs de cloud gérés facturent pour :
- Le transfert de données sortant du sandbox vers l’internet public
- Le transfert de données inter-régions si la région de votre sandbox diffère de celle de vos serveurs d’application
- Les téléchargements de fichiers volumineux dans les sandbox (par exemple, téléchargement de jeux de données, poids de modèles, paquets npm)
Les charges de travail des sandbox qui extraient des données externes — agents d’automatisation de navigateur récupérant des pages, agents de données téléchargeant des jeux de données, agents de codage clonant des dépôts — peuvent générer un transfert sortant important à grande échelle. Un agent de codage qui clone un dépôt de 500 Mo à chaque session et exécute 1 000 sessions par jour transfère 500 Go/jour de transfert sortant.
Ce qu’il faut demander : Le fournisseur facture-t-il le transfert sortant ? À quel taux ? Les données entrantes (téléchargements vers le sandbox) sont-elles également facturées ? Y a-t-il des plafonds de transfert sortant ou une limitation de débit aux niveaux de forfait inférieurs ?
De nombreux fournisseurs de sandbox ne publient pas de tarification explicite pour le transfert sortant et l’incluent plutôt dans des résumés de coûts réseau à l’échelle de la plateforme. Obtenez une réponse claire avant de passer à l’échelle.
Économie de la mise en cache des paquets
Installer des paquets Python, des dépendances npm ou des paquets système à l’intérieur d’un sandbox à chaque exécution coûte cher en temps, pas seulement en coût. Un pip install torch à froid peut prendre des minutes et ajouter une facturation de calcul significative à chaque session.
Les fournisseurs traitent cela différemment :
Pas de mise en cache : chaque sandbox démarre à partir d’une image de base et installe les paquets à partir de zéro à chaque fois. La latence de démarrage est élevée ; la facturation du calcul inclut le temps d’installation.
Mise en cache par modèle/instantané : vous créez un modèle de sandbox pré-construit avec les paquets installés. Les sessions démarrent à partir de cet instantané. Le démarrage est rapide ; le calcul d’installation des paquets est payé une fois lorsque le modèle est construit, pas par session.
Mise en cache implicite de couche : certains fournisseurs mettent en cache les couches de paquets automatiquement entre les sandbox de la même image, similaire à la mise en cache des couches Docker, de sorte que les paquets fréquemment utilisés sont extraits du cache plutôt que téléchargés à nouveau.
L’économie : si une tâche d’agent de 5 minutes nécessite 2 minutes d’installation de paquets par exécution, vous payez 40 % de votre facture de calcul pour la configuration, pas pour le travail. Les modèles ou instantanés éliminent cette surcharge au prix du stockage du modèle et de la complexité de gestion.
Ce qu’il faut demander : Le fournisseur prend-il en charge les modèles ou instantanés de sandbox ? Les modèles sont-ils facturés par modèle ou seulement lorsque des sessions en sont lancées ? À quelle fréquence les images de modèle doivent-elles être reconstruites (par exemple, lorsque les paquets de base sont mis à jour) ?
Novita Agent Sandbox prend en charge les modèles pour des environnements pré-construits. Les équipes exécutant des tâches à haute fréquence avec un ensemble de paquets cohérent devraient évaluer le coût de stockage du modèle par rapport aux économies de temps d’installation des paquets par session — pour la plupart des charges de travail, les modèles sont rapidement rentabilisés.
Temps d’inactivité et pause automatique
Les sandbox inactifs entre les étapes de l’agent gaspillent de l’argent. Un agent qui fait une pause de 30 secondes en attendant une réponse LLM consomme toujours de la facturation de calcul si le sandbox est actif.
Pause automatique / reprise automatique (parfois appelée pause/reprise ou instantané sur inactivité) signifie que le sandbox est figé lorsqu’aucun code n’est exécuté et n’est facturé que pour le calcul lorsqu’il est actif. Cela peut réduire considérablement les coûts pour les workflows avec de longues périodes d’attente LLM — par exemple, un agent de codage multi-tours où le LLM prend 10 secondes pour générer chaque extrait de code et le sandbox reste inactif pendant ces 10 secondes.
Ce qu’il faut demander : Le fournisseur prend-il en charge la pause automatique ? Qu’est-ce qui déclenche une pause (seuil de temps d’inactivité, appel API explicite) ? Quelle est la rapidité de la reprise — moins d’une seconde, ou plus proche d’un démarrage à froid complet ? Y a-t-il une différence de facturation entre un sandbox en pause et un sandbox en cours d’exécution ?
Le compromis : une pause automatique avec reprise lente ajoute de la latence à chaque étape de l’agent. Pour les charges de travail interactives sensibles à la latence, garder le sandbox chaud (et payer pour le temps d’inactivité) peut être la bonne décision. Pour les charges de travail par lots exécutées pendant la nuit, la pause automatique en vaut presque toujours la peine.
Auto-hébergé : le modèle de coût caché
Les déploiements de sandbox auto-hébergés ou BYOC (apportez votre propre cloud) ont une structure de coûts fondamentalement différente de celle des services cloud gérés. La facture d’infrastructure est inférieure par unité de calcul, mais les frais généraux d’exploitation sont réels.
Ce pour quoi vous payez en auto-hébergé :
- Coûts de VM ou bare-metal (généralement aux tarifs spot/réservés du cloud, qui sont inférieurs aux tarifs des sandbox gérés)
- Stockage : volumes EBS/persistants, stockage d’instantanés et transfert sortant de votre compte cloud
- Temps d’ingénierie des opérations : provisionnement, mise à l’échelle, correction de sécurité, durcissement et réponse aux incidents
- Infrastructure d’observabilité : logs, métriques, traçage pour les événements du cycle de vie du sandbox
- Travail de conformité : si vous avez besoin de contrôles SOC 2, HIPAA ou similaires, le travail incombe à votre équipe
L’erreur courante est de comparer les taux de calcul auto-hébergés aux taux des sandbox gérés et de conclure que l’option auto-hébergée est moins chère. Les frais généraux d’exploitation et de conformité coûtent souvent plus que les économies d’infrastructure, en particulier pour les équipes de moins de trois ingénieurs de plateforme capables de posséder l’infrastructure du sandbox à plein temps.
Là où l’auto-hébergé a du sens :
- Équipes disposant d’une infrastructure cloud existante et de capacités d’ingénierie de plateforme
- Environnements réglementaires où les données ne peuvent pas quitter un compte cloud ou une région spécifique
- Charges de travail à très haut volume où l’écart de coût entre géré et auto-hébergé à grande échelle dépasse les frais généraux d’exploitation
Novita Agent Sandbox prend en charge le déploiement BYOC dans les comptes AWS ou GCP pour les équipes qui ont besoin de sandbox fonctionnant dans leur propre VPC pour des raisons de conformité ou de politique réseau. E2B ne documente actuellement pas BYOC comme une option disponible pour les forfaits Pro standard, bien que cela puisse changer — vérifiez auprès de chaque fournisseur au moment de votre évaluation.
Estimations de coûts pour trois charges de travail courantes
Ces estimations utilisent la tarification documentée de Novita comme référence. Adaptez les estimations à la charge de travail réelle en termes de vCPU, mémoire, durée de session et nombre de sessions par jour. Vérifiez toujours les tarifs actuels avant d’utiliser ces chiffres pour la planification budgétaire.
Charge de travail 1 : Agent de codage (interactif, sessions courtes)
- Profil : 1 vCPU, 1 Gio RAM, session moyenne de 10 minutes, 500 sessions/jour
- Calcul : (0,0000098 × 600s) + (0,0000016 × 1 × 600s) = 0,00588 $ + 0,00096 $ = ~0,007 $ par session
- Quotidien : ~3,50 $/jour, ~105 $/mois pour 500 sessions/jour
- Variable clé : mise en cache des paquets — sans modèles, ajoutez 2–3 minutes de temps d’installation par session
Charge de travail 2 : Agent d’analyse de données (sessions moyennes, mémoire plus importante)
- Profil : 2 vCPU, 4 Gio RAM, session moyenne de 30 minutes, 100 sessions/jour
- Calcul : (0,0000196 × 1800s) + (0,0000016 × 4 × 1800s) = 0,03528 $ + 0,01152 $ = ~0,047 $ par session
- Quotidien : ~4,70 $/jour, ~141 $/mois pour 100 sessions/jour
- Variable clé : conservation des fichiers de sortie — si chaque session génère 100 Mo de sortie stockée, 100 sessions/jour = 10 Go/jour d’accumulation de stockage
Charge de travail 3 : Agent d’automatisation de navigateur (longues sessions, réseau intensif)
- Profil : 2 vCPU, 2 Gio RAM, session moyenne de 60 minutes, 50 sessions/jour
- Calcul : (0,0000196 × 3600s) + (0,0000016 × 2 × 3600s) = 0,07056 $ + 0,01152 $ = ~0,082 $ par session
- Quotidien : ~4,10 $/jour, ~123 $/mois pour 50 sessions/jour
- Variable clé : transfert sortant — agents de navigateur récupérant 10 Mo de données de page par session × 50 sessions = 500 Mo/jour de frais de transfert sortant potentiels
Ces estimations excluent les frais d’abonnement, le transfert sortant et le stockage persistant. Pour les fournisseurs avec un minimum d’abonnement mensuel, ajoutez ce coût fixe avant de comparer.
Questions à poser à tout fournisseur de sandbox
Utilisez cette liste lors de l’évaluation des fournisseurs de sandbox sur le coût :
Modèle de facturation
- La facturation est-elle à la seconde, à la minute ou en unités plus grandes ?
- Y a-t-il un frais minimum par session ou des frais de démarrage ?
- Un abonnement mensuel est-il requis pour accéder aux configurations de ressources personnalisées ou aux longues sessions ?
Calcul
- Le vCPU et la mémoire peuvent-ils être configurés indépendamment ?
- Quelles sont les allocations minimales et maximales de vCPU/mémoire ?
- Des sandbox avec GPU sont-ils disponibles et comment sont-ils facturés ?
Stockage
- Quelle quantité de stockage éphémère est incluse par sandbox ?
- Le stockage persistant/espace de travail est-il disponible ? À quel prix par Go/mois ?
- Y a-t-il des frais de stockage pour les instantanés ou les modèles ?
Transfert sortant
- Le transfert réseau sortant est-il facturé ? À quel taux ?
- Y a-t-il des niveaux de transfert sortant gratuits ?
Temps d’inactivité
- La pause automatique est-elle prise en charge ? Qu’est-ce qui la déclenche ?
- Quelle est la rapidité de la reprise à partir de l’état de pause ?
- Un sandbox en pause est-il facturé différemment d’un sandbox en cours d’exécution ?
Limites de session
- Quelle est la durée maximale de session à chaque niveau de forfait ?
- Que se passe-t-il lorsqu’une session dépasse la limite — terminaison gracieuse ou arrêt brutal ?
- Quelles limites de concurrence s’appliquent à chaque niveau ?
Mise en cache des paquets
- Les modèles ou instantanés sont-ils pris en charge ?
- Comment les constructions de modèles sont-elles facturées ?
Auto-hébergé / BYOC
- Le déploiement BYOC est-il pris en charge ?
- Quels fournisseurs de cloud (AWS, GCP, Azure) ?
- Quel support opérationnel est fourni ?
Stabilité des prix
- Quand les tarifs actuels ont-ils été mis à jour pour la dernière fois ?
- Y a-t-il une remise pour utilisation engagée ou volume disponible ?
Conclusion
La tarification des sandbox est plus qu’un taux par seconde. Le coût réel de l’exécution d’agents IA dans le cloud dépend de la façon dont les minimums de session, la configurabilité du calcul, la rétention de stockage, le transfert sortant, la mise en cache des paquets et la gestion du temps d’inactivité se combinent pour votre profil de charge de travail spécifique.
Il est important de bien comprendre cela avant de s’engager. Un fournisseur qui semble bon marché sur le taux de vCPU peut devenir coûteux lorsque vous ajoutez un abonnement de 150 $/mois pour débloquer des configurations de ressources personnalisées, ou des frais de transfert sortant sur un agent de navigateur qui récupère des mégaoctets de données de page par session. Inversement, un fournisseur avec pause automatique et modèles d’instantanés peut coûter nettement moins cher à grande échelle que ne le suggère le taux annoncé.
Utilisez les estimations et le cadre de questions de ce guide comme point de départ. Insérez la durée réelle de votre session, votre profil vCPU/mémoire, la fréquence des sessions et la croissance attendue du stockage — puis comparez cela avec la page de tarification actuelle de chaque fournisseur, et non avec des résumés marketing. La tarification des sandbox sur ce marché évolue activement, et le chiffre qui s’applique aujourd’hui pourrait ne pas s’appliquer dans six mois.
Pour les équipes déjà familiarisées avec le SDK d’E2B, Novita Agent Sandbox mérite d’être évalué : il utilise la même interface compatible E2B, facture à la seconde sans abonnement mensuel requis et prend en charge le déploiement BYOC pour les équipes ayant des contraintes de VPC ou de conformité. Qu’il corresponde à votre charge de travail dépend des variables ci-dessus.
FAQ
Quel est le moyen le moins cher d’exécuter des sandbox pour agents IA à grande échelle ?
Le coût total le plus bas dépend de votre combinaison de charges de travail. Pour les sessions courtes à haute fréquence, minimisez les frais généraux par session et utilisez des modèles pour éviter de payer le temps d’installation des paquets. Pour les sessions longues avec des temps d’attente LLM, la pause automatique réduit considérablement la facturation du calcul inactif. Comparez les fournisseurs sur le profil spécifique de vCPU, mémoire et durée de session qui correspond à votre cas d’utilisation — les taux annoncés ne reflètent pas votre coût réel sans intégrer ces variables.
L’auto-hébergement est-il toujours moins cher que les services de sandbox gérés ?
Pas nécessairement. L’infrastructure auto-hébergée a des coûts de calcul par unité inférieurs mais ajoute des frais généraux d’exploitation réels : provisionnement, mise à l’échelle, correction, observabilité et travail de conformité. Pour les équipes sans capacité d’ingénierie de plateforme dédiée, le coût d’exploitation dépasse souvent les économies d’infrastructure par rapport à un service géré. Évaluez le coût total de possession, pas seulement la facture cloud.
Comment la mise en cache des paquets affecte-t-elle la tarification des sandbox ?
Sans mise en cache, chaque démarrage de sandbox inclut le temps d’installation des paquets facturé comme du calcul. Pour les charges de travail Python qui installent des bibliothèques courantes de science des données ou de ML, l’installation peut ajouter 2 à 5 minutes de facturation de calcul par session. Les modèles ou instantanés vous permettent de payer l’installation des paquets une seule fois et de réutiliser cet environnement sur de nombreuses sessions. Pour toute charge de travail exécutant plus de quelques centaines de sessions par jour avec un ensemble de paquets cohérent, les modèles sont généralement rentabilisés rapidement.
À quoi dois-je faire attention avec la tarification du transfert sortant dans les charges de travail de sandbox ?
L’automatisation de navigateur, les agents d’ingestion de données et les charges de travail qui téléchargent des fichiers volumineux (jeux de données, poids de modèles, paquets depuis des registres externes) peuvent générer un transfert de données sortant important. Clarifiez si votre fournisseur de sandbox facture le transfert sortant et à quel taux avant de passer à l’échelle ces charges de travail. Dans certains cas, l’utilisation de miroirs de paquets, de modèles pré-construits ou de sources de données régionales au sein du même fournisseur cloud peut réduire considérablement les frais de transfert sortant.
Comment évaluer le coût du temps d’inactivité pour les agents avec des réponses LLM lentes ?
Estimez le rapport entre le temps d’attente LLM et le temps d’exécution actif dans votre charge de travail. Si un agent attend 10 secondes une réponse LLM entre chaque étape d’exécution de code de 2 secondes, environ 83 % du temps de session est inactif. Un fournisseur avec pause automatique qui facture uniquement le calcul actif économise la majeure partie de ce coût. Comparez la latence de pause/reprise avec la tolérance de votre charge de travail — si les utilisateurs attendent les résultats de manière interactive, une reprise lente ajoute un décalage notable.
