- Forfaits d'abonnement Claude
- Tarification API Claude par modèle
- Coût de l'abonnement Claude Code
- Comment les coûts des tokens API s'accumulent
- Réductions par lot et mise en cache
- Choisir le bon forfait ou le bon niveau de modèle
- Utiliser l'API LLM Novita AI comme alternative économique
- FAQ
- Articles recommandés
La tarification de Claude suit deux axes distincts : les abonnements pour une utilisation individuelle ou en équipe, et les coûts des tokens API pour les développeurs qui construisent directement avec les modèles. Les confondre conduit à de mauvaises décisions budgétaires. Ce guide couvre les deux axes, ce que chaque forfait débloque réellement, ce que vous payez par token sur l’API, et où se trouvent les vrais multiplicateurs de coûts — y compris Claude Code et l’utilisation agentique.
Forfaits d’abonnement Claude
Anthropic propose cinq niveaux pour accéder à Claude via claude.ai. Chaque forfait fixe un plafond d’utilisation pour l’interface de chat et Claude Code — l’accès à l’API est facturé séparément.
| Forfait | Prix mensuel | Annuel (par mois) | Pour qui |
|---|---|---|---|
| Free | 0 $ | 0 $ | Usage personnel léger |
| Pro | 20 $ | ~17 $ | Utilisateurs réguliers, développeurs |
| Max 5x | 100 $ | — | Utilisateurs quotidiens intensifs |
| Max 20x | 200 $ | — | Utilisateurs avancés, workflows agentiques |
| Team Standard | 25 $/siège | ~20 $/siège | Petites et moyennes équipes |
| Team Premium | 125 $/siège | ~100 $/siège | Équipes d’ingénierie ayant besoin de Claude Code |
| Enterprise | Sur mesure | Sur mesure | Grandes organisations, exigences de conformité |
Free
Le forfait Free donne un accès limité à Claude via l’interface Web, sans Claude Code ni accès à l’API. Idéal pour une utilisation occasionnelle ; ce n’est pas une option sérieuse pour le développement ou le travail quotidien productif.
Pro (20 $/mois)
Pro offre 5 fois plus d’utilisation que Free et débloque l’accès à tous les niveaux de modèles actuels — Haiku 4.5, Sonnet 4.6 et Opus 4.7. Claude Code est inclus. Le tarif annuel de 17 $/mois en fait le point d’entrée le plus rentable pour les développeurs individuels ou toute personne utilisant Claude comme outil principal.
Forfaits Max (100–200 $/mois)
Les niveaux Max existent parce que Claude Code et les sessions agentiques étendues consomment rapidement les quotas d’utilisation — environ 5 à 20 fois plus vite que le chat conversationnel. Si vous atteignez régulièrement les limites Pro sur des tâches de codage, Max 5x (100 $) couvre 5 fois l’utilisation de Pro. Max 20x (200 $) est destiné aux développeurs qui exécutent des agents multi-étapes ou de longues sessions de codage tout au long de la journée.
Forfaits Team (25–125 $/siège/mois)
Team Standard convient aux organisations qui souhaitent un espace de travail partagé, des contrôles d’administration et un accès standard aux modèles sans les exigences de Claude Code. Team Premium ajoute l’accès à Claude Code pour les équipes d’ingénierie et constitue l’équivalent pratique au niveau équipe d’un forfait Max. Un nombre minimum de sièges peut s’appliquer — consultez la page de tarification actuelle d’Anthropic.
Enterprise
La tarification Enterprise est sur mesure et comprend généralement un support dédié, des fonctionnalités avancées de sécurité et de conformité (SSO, journaux d’audit), ainsi que des plafonds de tarification négociés. Les tarifs de base commencent généralement autour de 20 $/siège plus l’utilisation de l’API, mais les conditions réelles dépendent de la taille du contrat et des exigences.
Tarification API Claude par modèle
L’accès à l’API est payant à l’utilisation, facturé par million de tokens (MTok). Les tokens d’entrée et de sortie sont facturés séparément. En juillet 2026, les niveaux de modèles actifs sont :
| Modèle | Entrée ($/MTok) | Sortie ($/MTok) | Fenêtre de contexte | Sortie maximale |
|---|---|---|---|---|
| Claude Opus 4.7 | 5,00 $ | 25,00 $ | 1 million de tokens | 128K tokens |
| Claude Sonnet 4.6 | 3,00 $ | 15,00 $ | 1 million de tokens | 128K tokens |
| Claude Haiku 4.5 | 1,00 $ | 5,00 $ | 200K tokens | 64K tokens |
Un schéma cohérent : les tokens de sortie coûtent 5 fois le tarif d’entrée à chaque niveau. Ce ratio est important pour l’estimation des coûts — un workflow qui génère de longues complétions dépensera la majeure partie de son budget de tokens en sortie.
Estimations pratiques par appel pour une tâche typique (4 000 tokens d’entrée + 500 tokens de sortie) :
- Haiku 4.5 : ~0,0065 $
- Sonnet 4.6 : ~0,019 $
- Opus 4.7 : ~0,032 $
Si vous passez à 100 000 appels/mois, la différence entre Haiku et Opus est d’environ 650 $ contre 3 200 $ — pour un volume de tâches identique.
Coût de l’abonnement Claude Code
Claude Code, l’agent de codage en terminal d’Anthropic, est inclus avec Pro et les forfaits supérieurs — il n’existe pas de niveau gratuit autonome. Ce qui varie entre les forfaits, c’est la profondeur d’utilisation :
- Pro (20 $/mois) : Accès à Claude Code inclus, mais les tâches complexes multi-fichiers ou à long horizon peuvent épuiser rapidement le plafond d’utilisation.
- Max 5x (100 $/mois) : 5 fois l’utilisation de Pro, adapté aux sessions de codage quotidiennes actives.
- Max 20x (200 $/mois) : Pour les développeurs qui utilisent Claude Code comme assistant IDE principal tout au long de la journée de travail.
- Team Premium (125 $/siège/mois) : Claude Code pour les équipes avec espace de travail partagé et contrôles d’administration.
Une précision utile : le forfait d’abonnement contrôle combien vous pouvez utiliser Claude Code via l’interface. Si vous construisez votre propre agent de codage sur l’API Anthropic, ce coût est séparé et facturé par token.
Comment les coûts des tokens API s’accumulent
Le calcul des tokens devient rapidement non évident, surtout avec des tâches utilisant beaucoup de contexte.
Le contexte compte plus que la longueur de la complétion. Si vous passez 100K tokens de contexte par appel et ne générez que 2K tokens en retour, vous dépensez 0,50 $ rien que pour l’entrée Opus 4.7 par appel. Les développeurs qui construisent des outils de questions-réponses sur documents, de révision de code ou de résumé de longs contextes doivent traiter le coût d’entrée comme la variable principale, et non la sortie.
Les boucles agentiques multiplient les tokens. Une seule session Claude Code qui lit une base de code, révise des fichiers et exécute des étapes de vérification peut générer 50K à 200K tokens sur l’ensemble de la conversation. Planifiez en conséquence.
Le choix du modèle est le plus grand levier de coût. Avant d’engager une charge de travail sur Opus 4.7, testez si Haiku 4.5 ou Sonnet 4.6 atteint une qualité acceptable. De nombreuses tâches de classification, d’extraction et de résumé fonctionnent bien sur Haiku avec un coût par token inférieur de 80 %.
Réductions par lot et mise en cache
Anthropic propose deux voies structurées de réduction des coûts :
Mise en cache des prompts
Pour les contextes répétés (prompts système, documents de référence, instantanés de codebase), la mise en cache des prompts évite de refacturer le prix d’entrée complet sur les tokens en cache. Les taux de lecture du cache sont nettement inférieurs — environ 90 % d’économies sur la partie en cache pour les prompts à forte réutilisation. Les écritures dans le cache ont une légère surtaxe ; l’économie est rentable lorsque le même bloc de contexte apparaît dans de nombreux appels.
API Batch
L’API Batch traite les requêtes de manière asynchrone et renvoie les résultats dans les 24 heures. Remise actuelle : 50 % sur les tokens d’entrée et de sortie sur les modèles pris en charge. C’est un choix direct pour les pipelines d’évaluation, la génération de contenu en masse, le traitement de données nocturne et toute charge de travail où la latence en temps réel n’est pas requise.
En combinant les deux : un pipeline d’analyse de documents qui réutilise un grand prompt système et traite les requêtes par lots peut réduire le coût effectif des tokens de 70 à 80 % par rapport aux appels synchrones non mis en cache.
Choisir le bon forfait ou le bon niveau de modèle
Quelques règles de décision qui tiennent vraiment :
Si vous utilisez Claude pour le chat et un peu de codage quelques fois par semaine : Pro à 20 $/mois est généralement suffisant. Le tarif annuel le ramène à environ 17 $/mois.
Si Claude Code est votre environnement de codage principal : Commencez par Max 5x (100 $/mois). Essayez d’abord Pro et surveillez si vous atteignez les limites en une semaine — si c’est le cas, passez à un niveau supérieur.
Si vous développez un produit basé sur l’API : Ne payez pas un abonnement comme substitut aux coûts API. Ils sont séparés. Achetez des crédits, utilisez l’API Batch pour les tâches non temps réel, et choisissez le modèle le moins cher qui passe le seuil de qualité pour votre tâche spécifique.
Pour les équipes : Team Standard couvre la plupart des besoins de collaboration. Team Premium n’a de sens que si les ingénieurs ont besoin de Claude Code à pleine profondeur d’utilisation — le tarif annuel de 100 $/siège correspond à peu près à un forfait individuel Max 5x.
Pour l’entreprise : Négociez sur le volume, pas sur le niveau. Le tarif annoncé par siège est un point de départ, pas un plafond.
Utiliser l’API LLM Novita AI comme alternative économique
Pour les développeurs qui construisent avec des modèles open source ou exécutent des charges de travail sensibles aux coûts, Novita AI LLM API fournit un point de terminaison compatible OpenAI pour des modèles comme Llama, Qwen, DeepSeek et GLM à des coûts de tokens nettement inférieurs. La tarification d’entrée commence à 0,02 $/million de tokens pour les petits modèles, et des modèles de taille moyenne performants comme les séries Qwen3 et DeepSeek V3 tournent à moins de 0,50 $/million de tokens pour l’entrée.
Cela a une importance pratique pour les utilisateurs de Claude Code : plusieurs modèles open source peuvent être utilisés comme backends Claude Code via la couche de compatibilité d’API, réduisant ainsi considérablement le coût par session de tokens. Par exemple, GLM-5 coûte 1,00 $ / 3,20 $ par million de tokens sur Novita AI — une fraction du tarif d’Opus 4.7 — et a été spécifiquement testé pour les workflows de codage agentiques. Consultez comment utiliser GLM-5 dans Claude Code pour un guide de configuration.
Pour les équipes exécutant des agents multi-étapes, Novita Agent Sandbox fournit des environnements d’exécution gérés pour l’automatisation du navigateur, l’exécution de code et les opérations sur fichiers — la couche d’infrastructure que les seuls appels API ne couvrent pas. Pour les considérations de tarification sur l’infrastructure du sandbox d’agent spécifiquement, voir modèles de tarification des sandbox d’agents IA.
Si l’optimisation budgétaire est le principal moteur, consultez la liste complète des 10 API LLM les moins chères en 2026 pour une comparaison classée entre fournisseurs.
FAQ
Combien coûte Claude par mois ?
Claude coûte 0 $ (Free), 20 $ (Pro), 100 $ (Max 5x) ou 200 $ (Max 20x) par mois pour les forfaits individuels. Les forfaits Team commencent à 25 $/siège (Standard) ou 125 $/siège (Premium). La tarification Enterprise est sur mesure.
Quelle est la tarification API de Claude ?
En juillet 2026 : Haiku 4.5 à 1 $/5 $ par million de tokens (entrée/sortie), Sonnet 4.6 à 3 $/15 $, et Opus 4.7 à 5 $/25 $. Tous les tarifs sont payants à l’utilisation sans minimum mensuel.
Combien coûte Claude Pro ?
20 $/mois facturé mensuellement, ou environ 17 $/mois sur un forfait annuel.
Quelle est la tarification de Claude Max ?
Max 5x est à 100 $/mois et Max 20x à 200 $/mois. Les deux sont des forfaits individuels pour une utilisation intensive de Claude, y compris Claude Code. Aucune option de facturation annuelle n’est actuellement répertoriée pour les niveaux Max.
Combien coûte Claude Code ?
Claude Code est inclus dans Pro (20 $/mois) et les forfaits supérieurs. Il n’y a pas de niveau gratuit. Team Premium (125 $/siège/mois) est le niveau recommandé pour les équipes d’ingénierie ayant besoin d’un accès complet à Claude Code.
Quel est le prix d’Anthropic Claude Opus 4 sur l’API ?
Claude Opus 4.7 (la version actuelle d’Opus 4) est à 5,00 $/MTok en entrée et 25,00 $/MTok en sortie. Les réductions pour mise en cache des prompts et API Batch s’appliquent.
Quel est le prix de Claude Sonnet 4 ?
Claude Sonnet 4.6 est à 3,00 $/MTok en entrée et 15,00 $/MTok en sortie.
Anthropic offre-t-il des réductions sur volume ?
Oui, via deux mécanismes : l’API Batch (50 % de réduction sur l’entrée et la sortie pour le traitement asynchrone) et la mise en cache des prompts (jusqu’à 90 % d’économies sur les blocs de contexte répétés). Les contrats Enterprise peuvent également inclure des plafonds de tarification négociés.
Quels sont les coûts de l’API Anthropic à grande échelle ?
À 10 millions d’appels/mois avec 4K entrée + 500 sortie tokens par appel : Haiku 4.5 totalise environ 65 000 $/mois avant réductions ; Sonnet 4.6 environ 195 000 $ ; Opus 4.7 environ 320 000 $. Les réductions de l’API Batch divisent ces montants approximativement par deux pour les charges de travail non temps réel.
