Como Usar o Kimi K2.7 Code no Claude Code via Novita AI

Como Usar o Kimi K2.7 Code no Claude Code via Novita AI

Kimi K2.7 Code é um modelo MoE especializado em codificação da MoonshotAI com uma janela de contexto de 256K, pensamento intercalado e chamada de ferramentas em várias etapas. Através do endpoint compatível com Anthropic da Novita AI, você pode conectá-lo diretamente ao Claude Code — mantendo seu fluxo de trabalho existente enquanto troca para um modelo construído especificamente para codificação agentic por uma fração do preço do Claude Sonnet.

Este guia percorre cada etapa: obter sua chave de API, configurar variáveis de ambiente e iniciar o Claude Code com moonshotai/kimi-k2.7-code como modelo.

Por que Usar o Kimi K2.7 Code no Claude Code?

O Claude Code usa o SDK da Anthropic internamente, então precisa de um endpoint compatível com a Anthropic — não um compatível com a OpenAI. A Novita AI expõe exatamente isso em https://api.novita.ai/anthropic, tornando o Kimi K2.7 Code um modelo plug-and-play para o Claude Code, sem bibliotecas de wrapper ou ferramentas extras.

O caso prático se resume a três pontos:

Custo. A $0,95 por milhão de tokens de entrada e $4,00 por milhão de tokens de saída na Novita AI (verificado em junho de 2026), o Kimi K2.7 Code é aproximadamente 68% mais barato na entrada e 73% mais barato na saída do que o Claude Sonnet 4.5 ($3,00/$15,00 por milhão de tokens). Para equipes executando centenas de tarefas de codificação por dia, essa diferença é significativa.

Contexto. A janela de contexto de 256K tokens significa que você pode enviar um contexto substancial do repositório — vários arquivos, saída de testes, notas de arquitetura — sem bater em um obstáculo no meio da sessão. A maioria dos agentes de codificação do dia a dia trabalha bem dentro de 32K–64K tokens; ter 256K significa que você raramente precisa podar o contexto.

Especialização em codificação. O Kimi K2.7 Code é construído especificamente para codificação e fluxos de trabalho agentic, não é um modelo de uso geral. Sua arquitetura de pensamento intercalado gera ~30% menos tokens de pensamento do que o Kimi K2.6, o que se traduz em respostas mais rápidas em tarefas de codificação de várias etapas.

Especificações do Kimi K2.7 Code em Resumo

Campo Valor
ID do modelo moonshotai/kimi-k2.7-code
Arquitetura Mixture of Experts (MoE)
Parâmetros totais 1T
Parâmetros ativados 32B por token
Janela de contexto 262.144 tokens (~256K)
Máximo de tokens de saída 262.144 tokens
Modalidades de entrada Texto, imagem, vídeo
Modalidade de saída Texto
Recursos Chamada de funções, saídas estruturadas, raciocínio (pensamento intercalado)
Endpoints na Novita AI chat/completions, anthropic

Para o Claude Code, use a família de endpoints anthropic — é o que o SDK da Anthropic espera.

Quanto Custa o Kimi K2.7 Code na Novita AI?

Tipo de token Preço Novita AI Preço Claude Sonnet 4.5
Entrada $0.95 / 1M $3.00 / 1M
Entrada de leitura de cache $0.19 / 1M
Saída $4.00 / 1M $15.00 / 1M

Preços baseados na página do modelo Kimi K2.7 Code na Novita AI em junho de 2026. A Novita AI também lista preços de cache de leitura, que são relevantes para fluxos de trabalho com contexto repetido, como agentes que reutilizam o mesmo prompt de sistema e esquema de ferramentas em várias chamadas.

Passo 1: Obtenha Sua Chave de API da Novita AI

Cadastre-se em uma conta Novita AI — novas contas ganham créditos de teste gratuitos.

Depois de autenticado:

  1. Acesse Gerenciamento de Chaves em seu painel.
  2. Clique em Criar Nova Chave.
  3. Copie a chave imediatamente e armazene-a em um local seguro — ela é exibida apenas uma vez.

Você usará esta chave como ANTHROPIC_AUTH_TOKEN na próxima etapa.

Passo 2: Instale o Claude Code

O Claude Code requer Node.js 18 ou superior. Verifique sua versão primeiro:

node --version

Instale o Claude Code globalmente:

npm install -g @anthropic-ai/claude-code

Verifique a instalação:

claude --version

Passo 3: Configure as Variáveis de Ambiente

O Claude Code lê quatro variáveis de ambiente para saber qual endpoint, chave de API e modelo usar. Defina todas as quatro — ANTHROPIC_SMALL_FAST_MODEL controla qual modelo o Claude Code usa para subtarefas leves, como resumos e edições rápidas.

Mac e Linux

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="YOUR_NOVITA_API_KEY"
export ANTHROPIC_MODEL="moonshotai/kimi-k2.7-code"
export ANTHROPIC_SMALL_FAST_MODEL="moonshotai/kimi-k2.7-code"

Para torná-las permanentes, adicione as quatro linhas ao ~/.zshrc ou ~/.bashrc, e então execute source ~/.zshrc (ou ~/.bashrc).

Windows (Prompt de Comando)

set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=YOUR_NOVITA_API_KEY
set ANTHROPIC_MODEL=moonshotai/kimi-k2.7-code
set ANTHROPIC_SMALL_FAST_MODEL=moonshotai/kimi-k2.7-code

Essas variáveis de ambiente duram apenas na sessão atual. Para configuração permanente no Windows, adicione-as através de Propriedades do Sistema → Variáveis de Ambiente.

O que cada variável faz

Variável Valor Finalidade
ANTHROPIC_BASE_URL https://api.novita.ai/anthropic Aponta o Claude Code para o endpoint compatível com Anthropic da Novita AI
ANTHROPIC_AUTH_TOKEN Sua chave de API da Novita Autentica suas requisições
ANTHROPIC_MODEL moonshotai/kimi-k2.7-code Define o modelo principal para tarefas de codificação
ANTHROPIC_SMALL_FAST_MODEL moonshotai/kimi-k2.7-code Define o modelo para subtarefas leves

Passo 4: Inicie o Claude Code

Navegue até o diretório do seu projeto e inicie uma sessão:

cd your-project-directory
claude .

O Claude Code abre um prompt interativo. Agora você pode descrever tarefas em inglês simples — implementar um recurso, corrigir um bug, refatorar um módulo, escrever testes — e o Kimi K2.7 Code lida com o raciocínio e a geração de código através do endpoint da Novita AI.

Para verificar se o modelo está roteando corretamente, execute /status dentro da sessão do Claude Code. Ele deve mostrar a URL base configurada e o modelo.

Dicas Práticas de Fluxo de Trabalho de Codificação

Envie mais contexto antecipadamente. Com 256K tokens disponíveis, você pode incluir o conteúdo completo de arquivos relevantes em vez de apenas trechos. O Claude Code pode referenciar o código real em vez de raciocinar a partir de resumos, o que reduz alucinações em detalhes de implementação.

Use pensamento intercalado para tarefas complexas. O Kimi K2.7 Code raciocina passo a passo antes de gerar código. Para refatorações em vários arquivos ou decisões de arquitetura, forneça ao modelo contexto suficiente para ver o panorama completo — ele planejará antes de escrever, o que reduz correções posteriores.

Depuração multimodal. O Kimi K2.7 Code aceita imagens e vídeos como entrada. Se seu fluxo de trabalho inclui relatórios de bugs baseados em capturas de tela ou tarefas de revisão de UI, você pode enviá-los diretamente para a sessão. As respostas são sempre em texto, então a saída é código, planos ou análise.

Prompts de sistema com cache intenso. Se você usa um prompt de sistema consistente em muitas sessões — padrões de codificação, convenções do projeto, notas de arquitetura — o preço de cache de leitura da Novita AI a $0,19 por milhão de tokens entra em ação em conteúdo repetido. Para equipes com prompts de sistema longos e estáveis, isso reduz significativamente o custo por tarefa.

Mantenha um modelo para consistência. Definir tanto ANTHROPIC_MODEL quanto ANTHROPIC_SMALL_FAST_MODEL para moonshotai/kimi-k2.7-code mantém o comportamento consistente entre a tarefa principal e as subtarefas. Se depois você quiser um modelo mais leve para subtarefas para economizar custos, pode trocar apenas ANTHROPIC_SMALL_FAST_MODEL.

Solução de Problemas

401 Não Autorizado

Sua chave de API está incorreta ou expirou. Verifique a chave em Gerenciamento de Chaves Novita AI. Verifique espaços extras ou quebras de linha ao copiar a chave.

Modelo não encontrado / 404

Confirme se o ID do modelo é exatamente moonshotai/kimi-k2.7-code — sem espaços extras, capitalização correta. Você pode verificar na página do modelo Kimi K2.7 Code.

Respostas lentas em prompts longos

Habilite o streaming por padrão no Claude Code — a maioria das configurações faz isso automaticamente. Para entradas de contexto muito longas (100K+ tokens), a latência da resposta inicial aumenta. Considere aparar o contexto de baixa prioridade primeiro.

Variáveis de ambiente não reconhecidas

No Mac/Linux, confirme que você executou o arquivo de perfil após editá-lo (source ~/.zshrc). No Windows, variáveis de ambiente definidas via set duram apenas na sessão atual do Prompt de Comando — use o painel Propriedades do Sistema para variáveis persistentes.

FAQ (Perguntas Frequentes)

O Kimi K2.7 Code funciona com o uso de ferramentas e integrações MCP do Claude Code?

Sim. O Kimi K2.7 Code suporta chamadas de função através do endpoint compatível com Anthropic da Novita AI, que é o que o Claude Code usa para chamadas de ferramentas e integrações MCP.

Por que usar o endpoint Anthropic em vez do compatível com OpenAI?

O Claude Code é construído no SDK da Anthropic. Ele se comunica usando o formato de mensagem da Anthropic, não da OpenAI. O endpoint https://api.novita.ai/anthropic da Novita AI traduz esse formato, então o Claude Code funciona sem qualquer modificação.

Como o Kimi K2.7 Code se compara ao Kimi K2.5 para o Claude Code?

O Kimi K2.7 Code gera aproximadamente 30% menos tokens de pensamento do que o K2.6 (e melhora a eficiência do K2.5), mantendo a qualidade de codificação. Para sessões do Claude Code com tarefas repetidas de várias etapas, menos tokens de pensamento significa respostas mais rápidas e menor custo de token por tarefa.

Posso usar esta configuração no VS Code ou Cursor?

Sim. O Claude Code se integra com VS Code e Cursor através de plugins e do terminal. A mesma configuração de variáveis de ambiente se aplica — uma vez definida, tanto as integrações de IDE quanto o terminal autônomo usam o modelo configurado.

Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de acessar modelos de última geração através de uma API simples, com infraestrutura de GPU acessível e confiável.

Artigos Recomendados