Use MiniMax M2.7 no Claude Code via Novita AI

Use MiniMax M2.7 no Claude Code via Novita AI

MiniMax M2.7 está disponível na Novita AI com um endpoint compatível com Anthropic, o que significa que você pode integrá-lo no Claude Code com quatro variáveis de ambiente e nenhuma outra alteração. O custo de entrada é de $0,30 por milhão de tokens — aproximadamente 23x mais barato que o Claude Opus 4.6 — enquanto o modelo mantém 97% de precisão em chamadas de ferramentas com mais de 40 ferramentas simultâneas. Este guia aborda a configuração exata, especificações verificadas, cálculos de custo e os trade-offs que vale a pena conhecer antes de se comprometer.

Resposta rápida: Defina ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic, ANTHROPIC_AUTH_TOKEN=<sua chave> e ANTHROPIC_MODEL=minimax/minimax-m2.7 antes de iniciar o Claude Code. Essa é a integração completa.

Experimente o MiniMax M2.7 na Novita AI

Por que o M2.7 funciona como backend do Claude Code

O Claude Code roteia cada leitura de arquivo, comando de terminal e edição por meio de chamadas de ferramentas. O modelo por trás dele precisa invocar essas ferramentas de forma confiável em sessões longas e com várias etapas — não apenas em prompts simples.

O principal destaque do M2.7 é 97% de precisão no seguimento de instruções com mais de 40 ferramentas simultâneas, cada uma com definições que excedem 2.000 tokens. Isso se alinha diretamente com a superfície de ferramentas do Claude Code: Read, Write, Edit, Bash, Glob, Grep, WebFetch e mais. Enquanto modelos com aderência mais fraca a ferramentas perdem parâmetros ou invocam a função errada no meio da sessão, o M2.7 mantém sua precisão.

Outro número relevante é a janela de contexto: 204.800 tokens. Isso é suficiente para manter uma grande base de código, histórico de conversa e resultados de ferramentas em contexto sem compactação forçada no meio da tarefa.

No que o M2.7 é bom no Claude Code:

  • Refatorações de vários arquivos que exigem encadeamento sustentado de ferramentas
  • Fluxos de depuração em produção (análise de logs → consultas ao banco de dados → correção)
  • Tarefas no estilo SWE-Bench: 56,2% no SWE-Bench Pro, 52,7% no Multi-SWE-Bench
  • Fluxos de agente que precisam de raciocínio consistente e de múltiplas voltas
  • Equipes sensíveis a custos executando muitas sessões simultâneas

Onde definir expectativas:

  • Modalidade de entrada somente texto (sem upload de imagens ou arquivos para o modelo)
  • Contexto de 204.800 tokens é grande, mas não é o nível de 1M do M3
  • A implantação auto-hospedada requer GPU significativa — o acesso via API é o caminho prático

Especificações da API MiniMax M2.7 na Novita AI

Campo Valor
ID do modelo minimax/minimax-m2.7
URL base Anthropic https://api.novita.ai/anthropic
URL base OpenAI https://api.novita.ai/openai/v1
Janela de contexto 204.800 tokens
Saída máxima 131.072 tokens
Modalidades de entrada Texto
Modalidades de saída Texto
Recursos suportados Chamada de funções, saída estruturada, raciocínio, modo JSON, compatibilidade com API Anthropic
Preço de entrada $0,30 por 1M tokens
Preço de saída $1,20 por 1M tokens
Preço de leitura em cache $0,06 por 1M tokens
Data verificada 2026-07-03, fonte: página do modelo Novita AI e MiniMax M2.7 na Novita

O endpoint compatível com Anthropic (/anthropic) é o que o Claude Code usa. O endpoint compatível com OpenAI funciona para chamadas de API diretas e outras ferramentas.

Passo 1: Obtenha sua chave de API da Novita AI

  1. Acesse novita.ai e crie uma conta (cadastro gratuito)
  2. Navegue até Configurações → Chaves de API
  3. Clique em Criar nova chave, nomeie-a (ex.: claude-code-m2.7) e copie a chave
  4. Mantenha a chave fora do código-fonte, repositórios públicos e notebooks compartilhados

Armazene-a como uma variável de ambiente em vez de codificá-la em qualquer lugar:

export NOVITA_API_KEY="sua_chave_aqui"

Passo 2: Instale o Claude Code

Se o Claude Code já estiver instalado, vá para o Passo 3.

macOS, Linux ou WSL:

curl -fsSL https://claude.ai/install.sh | bash

Windows PowerShell:

irm https://claude.ai/install.ps1 | iex

Windows CMD:

curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd

Usuários do Windows precisam do Git for Windows instalado primeiro.

Verifique a instalação:

claude --version

Passo 3: Configure as variáveis de ambiente

O Claude Code lê quatro variáveis para rotear requisições para um endpoint de modelo personalizado. Defina todas as quatro antes de iniciar o Claude Code.

macOS e Linux:

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<sua chave de API Novita>"
export ANTHROPIC_MODEL="minimax/minimax-m2.7"
export ANTHROPIC_SMALL_FAST_MODEL="minimax/minimax-m2.7"

Windows PowerShell:

$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "<sua chave de API Novita>"
$env:ANTHROPIC_MODEL = "minimax/minimax-m2.7"
$env:ANTHROPIC_SMALL_FAST_MODEL = "minimax/minimax-m2.7"

ANTHROPIC_SMALL_FAST_MODEL controla operações leves como navegação em arquivos e buscas rápidas. Definir como o mesmo modelo mantém todas as requisições no mesmo caminho de faturamento e preço.

Para tornar a configuração persistente, adicione as linhas de exportação ao seu perfil de shell (~/.bashrc, ~/.zshrc ou perfil do PowerShell). Ou mantenha um arquivo .env no nível do projeto e carregue-o antes de cada sessão — apenas não o envie para o controle de versão.

Passo 4: Inicie o Claude Code e verifique

Navegue até o diretório do seu projeto e inicie o Claude Code:

cd seu-diretório-do-projeto
claude .

No prompt, execute um teste rápido:

> Quais arquivos estão neste diretório?

Se o modelo responder com uma lista de arquivos invocando a ferramenta apropriada, a integração está funcionando. Você pode confirmar o modelo em uso e verificar os custos de token por requisição no seu painel de uso da Novita AI.

Se você vir um erro de autenticação, verifique novamente se ANTHROPIC_AUTH_TOKEN está definido na sessão atual do shell — e não apenas em uma janela de terminal diferente.

Passo 5: Otimize para fluxos de agente

A aderência de 97% a ferramentas e a janela de contexto de 204.800 tokens do M2.7 o tornam adequado para sessões de agente estendidas. Algumas práticas que extraem mais dessas capacidades:

Forneça ao modelo o contexto completo da base de código primeiro. Antes de pedir uma alteração, deixe o Claude Code ler os arquivos relevantes. A grande janela de contexto do M2.7 permite carregar vários módulos sem atingir limites precocemente.

> Leia todos os arquivos em src/api/ e identifique quaisquer funções que lidam com autenticação

Use decomposição explícita de tarefas para trabalhos complexos. Dividir uma grande solicitação em etapas sequenciais reduz a chance de saída parcial ou confusão no meio da sessão:

> Primeiro, analise o esquema atual do banco de dados. Depois, proponha a migração necessária para adicionar exclusões suaves. Não escreva nenhum código ainda.

Aproveite o encadeamento de ferramentas para depuração. A força do M2.7 em depuração de produção é mais visível em sequências de várias etapas: reproduzir → rastrear → corrigir → verificar.

> Execute o conjunto de testes, identifique testes com falha, encontre a causa raiz no código-fonte e proponha uma correção

Mantenha as sessões focadas. O M2.7 lida bem com coerência em várias voltas, mas sessões mais estreitas com objetivos claros produzem resultados mais confiáveis do que sessões exploratórias abertas que mudam de direção repetidamente.

Análise de custos

A $0,3/$1,2 por milhão de tokens (entrada/saída), o M2.7 é materialmente mais barato do que a maioria das opções de ponta, mantendo-se competitivo em benchmarks de agente.

Custos típicos de fluxo de trabalho do Claude Code com M2.7 via Novita AI:

Fluxo de trabalho Custo estimado
Pequena refatoração (5 arquivos, ~200 linhas alteradas) $0,02–$0,05
Implementação de funcionalidade (20 arquivos, ~1000 linhas) $0,10–$0,20
Análise completa da base de código (100+ arquivos) $0,25–$0,60
Uma hora de codificação contínua a 100 tokens/s ~$0,27

Comparação de custos de modelos para uso no Claude Code:

Modelo Entrada por 1M tokens Saída por 1M tokens vs. entrada M2.7
MiniMax M2.7 (Novita AI) $0,30 $1,20
MiniMax M2.5 (Novita AI) $0,30 $1,20 igual
GLM-5 (Novita AI) $1,00 $3,20 3,3x mais
Claude Opus 4.6 ~$7,00 ~$21,00 23x mais

Fontes: Páginas de modelo da Novita AI, verificadas em 2026-07-03. Verifique os preços atuais antes de orçar cargas de trabalho de produção.

O cache de prompt reduz ainda mais os custos em contexto repetido. A $0,06/Mt para leituras de cache, cargas de trabalho com prompts de sistema estáveis ou grande contexto compartilhado se beneficiam significativamente.

Casos de uso reais

Refatoração de vários arquivos. O 52,7% do M2.7 no Multi-SWE-Bench mostra que ele pode lidar com alterações complexas entre arquivos. O Claude Code fornece a camada de aprovação interativa — revise cada alteração proposta antes de confirmar.

SRE de produção e resposta a incidentes. O modelo foi treinado em cenários de depuração de produção: correlacionar métricas, consultar bancos de dados, rastrear causas raiz, aplicar correções não bloqueantes. A integração de terminal do Claude Code permite que ele execute diagnósticos e verifique correções na mesma sessão.

Desenvolvimento de frameworks de agente. Se você está construindo algo que orquestra outras ferramentas ou modelos, o suporte nativo a Agent Teams e a consistência de papéis do M2.7 o tornam uma escolha sólida para a camada orquestradora. Sua aderência de 97% a ferramentas importa mais aqui do que pontuações brutas em benchmarks.

Bases de código poliglotas. O M2.7 mostra forte desempenho em várias linguagens de programação e lida com projetos multilíngues sem a queda de qualidade que às vezes se vê em modelos treinados principalmente em Python/JavaScript.

Equipes sensíveis a custos escalando fluxos de agente. A $0,30/Mt de entrada, equipes executando sessões contínuas do Claude Code em vários desenvolvedores podem manter os custos gerenciáveis sem cair para um modelo significativamente mais fraco.

Solução de problemas

Erro de autenticação (401)

Verifique se ANTHROPIC_AUTH_TOKEN está definido na sessão ativa do shell. A variável deve ser exportada antes de executar claude .. Regenerar a chave e reexportá-la é a correção mais rápida se você suspeitar de corrupção na chave.

Modelo não encontrado

Confirme que o ID do modelo é exatamente minimax/minimax-m2.7 — sem espaços, sem alterações de maiúsculas/minúsculas. Nomes de exibição como MiniMax M2.7 não funcionam como IDs de modelo.

Requisições chegando ao Anthropic em vez da Novita

Verifique se ANTHROPIC_BASE_URL está definido como https://api.novita.ai/anthropic. Se a variável estiver ausente ou em branco, o Claude Code volta para o endpoint do Anthropic e rejeitará requisições sem uma chave Anthropic válida.

Respostas lentas na primeira requisição

A primeira requisição em uma sessão pode levar alguns segundos extras devido ao comportamento de inicialização a frio. Requisições subsequentes na mesma sessão geralmente são mais rápidas. Se a lentidão persistir entre requisições, tente reduzir max_tokens em chamadas de teste para isolar se é tempo de geração ou latência de rede.

Erros de janela de contexto

O M2.7 suporta 204.800 tokens. Se você estiver carregando bases de código muito grandes, o gerenciamento de contexto do Claude Code lidará com a compactação automaticamente. Para controle manual, limite os arquivos que você pede ao Claude Code para ler em uma única vez.

Custos mais altos que o esperado

Verifique ANTHROPIC_SMALL_FAST_MODEL. Se estiver apontando para um modelo diferente e mais caro, operações leves como navegação em diretórios custarão mais do que o esperado. Definir ambas as variáveis como minimax/minimax-m2.7 normaliza todo o tráfego.

Perguntas Frequentes

O MiniMax M2.7 está disponível na Novita AI com o endpoint compatível com Anthropic?

Sim. O modelo está disponível como minimax/minimax-m2.7 com endpoints compatíveis com OpenAI e Anthropic. O Claude Code usa o caminho Anthropic em https://api.novita.ai/anthropic.

Qual é a diferença entre o M2.7 e o M2.5 para fluxos de trabalho no Claude Code?

O M2.7 é o modelo mais forte em todos os benchmarks: SWE-Bench Pro melhorou de 52,2% para 56,2%, Multi-SWE-Bench de 51,3% para 52,7% e MLE-Bench lite de 31,5% para 66,6%. O preço é o mesmo ($0,3/$1,2 por milhão de tokens), então não há razão de custo para usar o M2.5 em vez do M2.7 em novas configurações.

O M2.7 suporta entrada de visão ou imagens no Claude Code?

Não. O MiniMax M2.7 é apenas texto. Se seu fluxo de trabalho envolve capturas de tela, análise de UI ou contexto de imagem, você precisaria de um modelo multimodal. Para fluxos de codificação baseados em texto, essa limitação não se aplica.

Posso usar o M2.7 no Claude Code junto com ferramentas MCP?

Sim. O suporte ao MCP (Model Context Protocol) do Claude Code funciona na camada de ferramenta, não na camada de modelo. A alta aderência a ferramentas do M2.7 o torna um bom candidato para configurações com muitos MCPs.

A chamada de função funciona de forma confiável para as ferramentas integradas do Claude Code?

Sim. O M2.7 foi treinado especificamente para alta precisão em chamadas de ferramentas — 97% de aderência em mais de 40 ferramentas simultâneas em condições de produção. As ferramentas integradas do Claude Code (Read, Write, Edit, Bash, Glob, Grep) estão bem dentro desse intervalo.

Esta configuração funcionará com a extensão VS Code do Claude Code?

As variáveis de ambiente se aplicam ao runtime da CLI. Se você estiver usando a extensão VS Code, defina as variáveis no seu perfil de shell ou nas configurações do terminal integrado do VS Code para que estejam disponíveis quando a extensão iniciar uma sessão do Claude Code.

Artigos Recomendados

MiniMax M2.7 na Novita AI: Inteligência de Primeiro Nível, Preço Acessível Cobertura completa do lançamento: arquitetura de autoevolução do M2.7, resultados de benchmark, capacidades de agente e comparação de preços com GLM-5 e Kimi K2.5 na Novita AI.

Use MiniMax M2.5 no Claude Code: Guia de Codificação com Agentes Mesmo padrão de integração para o M2.5 — útil se você estiver comparando M2.5 e M2.7 para seu fluxo de trabalho, ou migrando uma configuração existente do M2.5 para o M2.7.

Como Usar GLM-5 no Claude Code: Guia de Configuração Guia de configuração para GLM-5 no Claude Code via Novita AI — o modelo com benchmarks mais próximos ao M2.7 no Intelligence Index, com preço e tamanho de contexto diferentes.


Novita AI é a plataforma de nuvem de IA e agentes que ajuda desenvolvedores e startups a construir, implantar e escalar modelos e aplicações de agentes com alto desempenho, confiabilidade e eficiência de custos.