O preço do Claude possui duas categorias distintas: planos de assinatura para uso individual e em equipe, e custos de tokens da API para desenvolvedores que constroem diretamente com os modelos. Misturá-los leva a más decisões orçamentárias. Este guia aborda ambas as categorias, o que cada plano realmente desbloqueia, o que você paga por token na API e onde estão os multiplicadores reais de custo — incluindo Claude Code e uso agentivo.
Planos de Assinatura do Claude
A Anthropic oferece cinco níveis para acessar o Claude através do claude.ai. Cada plano define um limite de uso para a interface de chat e o Claude Code — o acesso à API é cobrado separadamente.
| Plano | Preço Mensal | Anual (por mês) | Para Quem É |
|---|---|---|---|
| Gratuito | $0 | $0 | Uso pessoal leve |
| Pro | $20 | ~$17 | Usuários regulares, desenvolvedores |
| Max 5x | $100 | — | Usuários intensivos diários |
| Max 20x | $200 | — | Usuários avançados, fluxos agentivos |
| Equipe Padrão | $25/assento | ~$20/assento | Equipes pequenas a médias |
| Equipe Premium | $125/assento | ~$100/assento | Equipes de engenharia que precisam de Claude Code |
| Enterprise | Personalizado | Personalizado | Grandes organizações, requisitos de conformidade |
Gratuito
O plano gratuito oferece acesso limitado ao Claude pela interface web, sem Claude Code e sem acesso à API. Bom para uso ocasional; não é uma opção séria para desenvolvimento ou produtividade diária.
Pro ($20/mês)
O Pro oferece 5 vezes mais uso que o Gratuito e desbloqueia acesso a todos os níveis de modelo atuais — Haiku 4.5, Sonnet 4.6 e Opus 4.7. O Claude Code está incluído. A taxa anual de $17/mês torna este o ponto de entrada mais econômico para desenvolvedores individuais ou qualquer pessoa que use o Claude como ferramenta principal.
Planos Max ($100–$200/mês)
Os níveis Max existem porque o Claude Code e sessões agentivas estendidas consomem rapidamente os limites de uso — aproximadamente 5 a 20 vezes mais rápido que o chat conversacional. Se você atinge os limites do Pro regularmente em tarefas de codificação, o Max 5x ($100) cobre 5x o uso do Pro. O Max 20x ($200) é para desenvolvedores que executam agentes multi-etapas ou longas sessões de codificação ao longo do dia.
Planos para Equipes ($25–$125/assento/mês)
O Equipe Padrão é adequado para organizações que desejam espaço de trabalho compartilhado, controles administrativos e acesso padrão a modelos sem requisitos do Claude Code. O Equipe Premium adiciona acesso ao Claude Code para equipes de engenharia e é o equivalente prático a nível de equipe de um plano Max. Números mínimos de assentos podem ser aplicados — verifique a página de preços atual da Anthropic.
Enterprise
O Enterprise tem preços personalizados e normalmente inclui suporte dedicado, recursos avançados de segurança e conformidade (SSO, logs de auditoria) e limites de taxa negociados. As taxas base geralmente começam em torno de $20/assento mais uso da API, mas os termos reais dependem do tamanho do contrato e dos requisitos.
Preços da API do Claude por Modelo
O acesso à API é pré-pago, cobrado por milhão de tokens (MTok). Tokens de entrada e saída são precificados separadamente. Em julho de 2026, os níveis de modelo ativos são:
| Modelo | Entrada ($/MTok) | Saída ($/MTok) | Janela de Contexto | Saída Máxima |
|---|---|---|---|---|
| Claude Opus 4.7 | $5,00 | $25,00 | 1M tokens | 128K tokens |
| Claude Sonnet 4.6 | $3,00 | $15,00 | 1M tokens | 128K tokens |
| Claude Haiku 4.5 | $1,00 | $5,00 | 200K tokens | 64K tokens |
Um padrão consistente: os tokens de saída custam 5× a taxa de entrada em cada nível. Essa proporção é importante para a estimativa de custos — um fluxo de trabalho que gera respostas longas gastará a maior parte do seu orçamento de tokens na saída.
Estimativas práticas por chamada para uma tarefa típica (4.000 tokens de entrada + 500 tokens de saída):
- Haiku 4.5: ~$0,0065
- Sonnet 4.6: ~$0,019
- Opus 4.7: ~$0,032
Escalone isso para 100.000 chamadas/mês e a diferença entre Haiku e Opus é de aproximadamente $650 vs $3.200 — para o mesmo volume de tarefas.
Custo da Assinatura do Claude Code
O Claude Code, agente de codificação baseado em terminal da Anthropic, está incluído no Pro e superiores — não há um nível gratuito independente para ele. O que varia entre os planos é a profundidade de uso:
- Pro ($20/mês): Acesso ao Claude Code incluído, mas tarefas complexas de múltiplos arquivos ou de longo horizonte podem esgotar rapidamente o limite de uso.
- Max 5x ($100/mês): 5x o uso do Pro, adequado para sessões de codificação diárias ativas.
- Max 20x ($200/mês): Para desenvolvedores que usam o Claude Code como assistente principal de IDE durante todo o dia de trabalho.
- Equipe Premium ($125/assento/mês): Claude Code para equipes com espaço de trabalho compartilhado e controles administrativos.
Um esclarecimento importante: o plano de assinatura controla o quanto você pode usar o Claude Code através da interface. Se você construir seu próprio agente de codificação sobre a API da Anthropic, esse custo é separado e cobrado por token.
Como os Custos de Tokens da API se Acumulam
A matemática dos tokens torna-se rapidamente não óbvia, especialmente com tarefas que consomem muito contexto.
O contexto importa mais que o tamanho da resposta. Se você passar 100K tokens de contexto por chamada e gerar apenas 2K tokens de volta, estará gastando $0,50 apenas na entrada do Opus 4.7, por chamada. Desenvolvedores que constroem ferramentas de Q&A sobre documentos, revisão de código ou sumarização de contexto longo precisam tratar o custo de entrada como a variável principal, não a saída.
Loops agentivos multiplicam tokens. Uma única sessão do Claude Code que lê uma base de código, revisa arquivos e executa etapas de verificação pode gerar 50K–200K tokens ao longo de toda a conversa. Planeje de acordo.
A escolha do modelo é a maior alavanca de custo. Antes de comprometer uma carga de trabalho com o Opus 4.7, teste se o Haiku 4.5 ou o Sonnet 4.6 atinge qualidade aceitável. Muitas tarefas de classificação, extração e sumarização funcionam bem no Haiku com 80% menos custo por token.
Descontos de Lote e Cache
A Anthropic oferece dois caminhos estruturados de redução de custos:
Cache de Prompt
Para contexto repetido (prompts de sistema, documentos de referência, snapshots de base de código), o cache de prompt evita recobrar o preço total de entrada em tokens em cache. As taxas de leitura de cache são significativamente mais baixas — aproximadamente 90% de economia na parte em cache para prompts de alto reuso. As gravações em cache têm uma pequena sobretaxa; a economia funciona quando o mesmo bloco de contexto aparece em muitas chamadas.
API de Lote
A API de Lote processa solicitações de forma assíncrona e retorna resultados dentro de 24 horas. Desconto atual: 50% de desconto tanto nos tokens de entrada quanto de saída nos modelos suportados. Isso é um ajuste direto para pipelines de avaliação, geração de conteúdo em massa, processamento noturno de dados e qualquer carga de trabalho onde a latência em tempo real não é necessária.
Combinando ambos: um pipeline de análise de documentos que reutiliza um prompt de sistema grande e processa solicitações em lotes pode reduzir o custo efetivo do token em 70–80% em comparação com chamadas síncronas e sem cache.
Escolhendo o Plano ou Nível de Modelo Certo
Algumas regras de decisão que realmente se aplicam:
Se você usa o Claude para chat e codificação leve algumas vezes por semana: O Pro a $20/mês geralmente é suficiente. A taxa anual reduz para ~$17/mês.
Se o Claude Code é seu principal ambiente de codificação: Comece com o Max 5x ($100/mês). Comece pelo Pro primeiro e monitore se você atinge os limites dentro de uma semana — se sim, faça o upgrade.
Se você está construindo um produto baseado em API: Não pague por uma assinatura como substituto dos custos da API. Eles são separados. Compre créditos, use a API de Lote para trabalhos não em tempo real e escolha o modelo mais barato que atenda ao padrão de qualidade para sua tarefa específica.
Para equipes: O Equipe Padrão cobre a maioria das necessidades de colaboração. O Equipe Premium só faz sentido se os engenheiros precisarem do Claude Code com profundidade total de uso — a taxa anual de $100/assento corresponde aproximadamente a um plano individual Max 5x.
Para empresas: Negocie com base no volume, não no nível. A taxa por assento indicada é um ponto de partida, não um limite.
Usando a API LLM da Novita AI como Alternativa de Custo
Para desenvolvedores que constroem com modelos de código aberto ou executam cargas de trabalho sensíveis a custo, a API LLM da Novita AI fornece um endpoint compatível com OpenAI para modelos como Llama, Qwen, DeepSeek e GLM a custos de token substancialmente mais baixos. O preço de entrada começa em $0,02/milhão de tokens para modelos menores, e modelos de tamanho médio capazes como as séries Qwen3 e DeepSeek V3 custam menos de $0,50/milhão de tokens para entrada.
Isso importa na prática para usuários do Claude Code: vários modelos de código aberto podem ser usados como backends do Claude Code através da camada de compatibilidade da API, reduzindo significativamente o custo de token por sessão. Por exemplo, o GLM-5 custa $1,00/$3,20 por milhão de tokens na Novita AI — uma fração da taxa do Opus 4.7 — e foi especificamente testado para fluxos de trabalho de codificação agentivos. Veja como usar o GLM-5 no Claude Code para um guia de configuração.
Para equipes que executam agentes multi-etapas, o Novita Agent Sandbox fornece ambientes de execução gerenciados para automação de navegador, execução de código e operações de arquivo — a camada de infraestrutura que apenas as chamadas de API não cobrem. Para considerações de preços especificamente sobre infraestrutura de sandbox de agente, veja modelos de preços de sandbox de agente de IA.
Se a otimização de orçamento é o principal impulsionador, veja a lista completa das 10 APIs LLM mais baratas em 2026 para uma comparação classificada entre provedores.
FAQ
Quanto custa o Claude por mês?
O Claude custa $0 (Gratuito), $20 (Pro), $100 (Max 5x) ou $200 (Max 20x) por mês para planos individuais. Os planos para equipes começam em $25/assento (Padrão) ou $125/assento (Premium). O preço Enterprise é personalizado.
Qual é o preço da API do Claude?
Em julho de 2026: Haiku 4.5 a $1/$5 por milhão de tokens (entrada/saída), Sonnet 4.6 a $3/$15 e Opus 4.7 a $5/$25. Todas as taxas são pré-pagas, sem mínimo mensal.
Quanto custa o Claude Pro?
$20/mês na fatura mensal, ou aproximadamente $17/mês no plano anual.
Qual é o preço do Claude Max?
Max 5x é $100/mês e Max 20x é $200/mês. Ambos são planos individuais para uso intensivo do Claude, incluindo Claude Code. Atualmente não há opção de faturamento anual listada para os níveis Max.
Quanto custa o Claude Code?
O Claude Code está incluído no Pro ($20/mês) e superiores. Não há nível gratuito. O Equipe Premium ($125/assento/mês) é o nível recomendado para equipes de engenharia que precisam de acesso total ao Claude Code.
Qual é o preço do Anthropic Claude Opus 4 na API?
Claude Opus 4.7 (a versão atual do Opus 4) custa $5,00/MTok de entrada e $25,00/MTok de saída. Descontos de cache de prompt e API de Lote se aplicam.
Qual é o preço do Claude Sonnet 4?
Claude Sonnet 4.6 custa $3,00/MTok de entrada e $15,00/MTok de saída.
A Anthropic oferece descontos por volume?
Sim, através de dois mecanismos: a API de Lote (50% de desconto na entrada e saída para processamento assíncrono) e o cache de prompt (até 90% de economia em blocos de contexto repetidos). Contratos Enterprise também podem incluir limites de taxa negociados.
Quais são os custos da API da Anthropic em escala?
A 10 milhões de chamadas/mês com 4K de entrada + 500 tokens de saída por chamada: Haiku 4.5 totaliza ~$65.000/mês antes dos descontos; Sonnet 4.6 ~$195.000; Opus 4.7 ~$320.000. Os descontos da API de Lote reduzem esses valores aproximadamente pela metade para cargas de trabalho não em tempo real.
