- Por que Usar o Kimi K2.7 Code no Claude Code?
- Especificações do Kimi K2.7 Code em Resumo
- Quanto Custa o Kimi K2.7 Code na Novita AI?
- Passo 1: Obtenha Sua Chave de API da Novita AI
- Passo 2: Instale o Claude Code
- Passo 3: Configure as Variáveis de Ambiente
- Passo 4: Inicie o Claude Code
- Dicas Práticas de Fluxo de Trabalho de Codificação
- Solução de Problemas
- FAQ (Perguntas Frequentes)
- Artigos Recomendados
Kimi K2.7 Code é um modelo MoE especializado em codificação da MoonshotAI com uma janela de contexto de 256K, pensamento intercalado e chamada de ferramentas em várias etapas. Através do endpoint compatível com Anthropic da Novita AI, você pode conectá-lo diretamente ao Claude Code — mantendo seu fluxo de trabalho existente enquanto troca para um modelo construído especificamente para codificação agentic por uma fração do preço do Claude Sonnet.
Este guia percorre cada etapa: obter sua chave de API, configurar variáveis de ambiente e iniciar o Claude Code com moonshotai/kimi-k2.7-code como modelo.
Por que Usar o Kimi K2.7 Code no Claude Code?
O Claude Code usa o SDK da Anthropic internamente, então precisa de um endpoint compatível com a Anthropic — não um compatível com a OpenAI. A Novita AI expõe exatamente isso em https://api.novita.ai/anthropic, tornando o Kimi K2.7 Code um modelo plug-and-play para o Claude Code, sem bibliotecas de wrapper ou ferramentas extras.
O caso prático se resume a três pontos:
Custo. A $0,95 por milhão de tokens de entrada e $4,00 por milhão de tokens de saída na Novita AI (verificado em junho de 2026), o Kimi K2.7 Code é aproximadamente 68% mais barato na entrada e 73% mais barato na saída do que o Claude Sonnet 4.5 ($3,00/$15,00 por milhão de tokens). Para equipes executando centenas de tarefas de codificação por dia, essa diferença é significativa.
Contexto. A janela de contexto de 256K tokens significa que você pode enviar um contexto substancial do repositório — vários arquivos, saída de testes, notas de arquitetura — sem bater em um obstáculo no meio da sessão. A maioria dos agentes de codificação do dia a dia trabalha bem dentro de 32K–64K tokens; ter 256K significa que você raramente precisa podar o contexto.
Especialização em codificação. O Kimi K2.7 Code é construído especificamente para codificação e fluxos de trabalho agentic, não é um modelo de uso geral. Sua arquitetura de pensamento intercalado gera ~30% menos tokens de pensamento do que o Kimi K2.6, o que se traduz em respostas mais rápidas em tarefas de codificação de várias etapas.
Especificações do Kimi K2.7 Code em Resumo
| Campo | Valor |
|---|---|
| ID do modelo | moonshotai/kimi-k2.7-code |
| Arquitetura | Mixture of Experts (MoE) |
| Parâmetros totais | 1T |
| Parâmetros ativados | 32B por token |
| Janela de contexto | 262.144 tokens (~256K) |
| Máximo de tokens de saída | 262.144 tokens |
| Modalidades de entrada | Texto, imagem, vídeo |
| Modalidade de saída | Texto |
| Recursos | Chamada de funções, saídas estruturadas, raciocínio (pensamento intercalado) |
| Endpoints na Novita AI | chat/completions, anthropic |
Para o Claude Code, use a família de endpoints anthropic — é o que o SDK da Anthropic espera.
Quanto Custa o Kimi K2.7 Code na Novita AI?
| Tipo de token | Preço Novita AI | Preço Claude Sonnet 4.5 |
|---|---|---|
| Entrada | $0.95 / 1M | $3.00 / 1M |
| Entrada de leitura de cache | $0.19 / 1M | — |
| Saída | $4.00 / 1M | $15.00 / 1M |
Preços baseados na página do modelo Kimi K2.7 Code na Novita AI em junho de 2026. A Novita AI também lista preços de cache de leitura, que são relevantes para fluxos de trabalho com contexto repetido, como agentes que reutilizam o mesmo prompt de sistema e esquema de ferramentas em várias chamadas.
Passo 1: Obtenha Sua Chave de API da Novita AI
Cadastre-se em uma conta Novita AI — novas contas ganham créditos de teste gratuitos.
Depois de autenticado:
- Acesse Gerenciamento de Chaves em seu painel.
- Clique em Criar Nova Chave.
- Copie a chave imediatamente e armazene-a em um local seguro — ela é exibida apenas uma vez.
Você usará esta chave como ANTHROPIC_AUTH_TOKEN na próxima etapa.
Passo 2: Instale o Claude Code
O Claude Code requer Node.js 18 ou superior. Verifique sua versão primeiro:
node --version
Instale o Claude Code globalmente:
npm install -g @anthropic-ai/claude-code
Verifique a instalação:
claude --version
Passo 3: Configure as Variáveis de Ambiente
O Claude Code lê quatro variáveis de ambiente para saber qual endpoint, chave de API e modelo usar. Defina todas as quatro — ANTHROPIC_SMALL_FAST_MODEL controla qual modelo o Claude Code usa para subtarefas leves, como resumos e edições rápidas.
Mac e Linux
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="YOUR_NOVITA_API_KEY"
export ANTHROPIC_MODEL="moonshotai/kimi-k2.7-code"
export ANTHROPIC_SMALL_FAST_MODEL="moonshotai/kimi-k2.7-code"
Para torná-las permanentes, adicione as quatro linhas ao ~/.zshrc ou ~/.bashrc, e então execute source ~/.zshrc (ou ~/.bashrc).
Windows (Prompt de Comando)
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=YOUR_NOVITA_API_KEY
set ANTHROPIC_MODEL=moonshotai/kimi-k2.7-code
set ANTHROPIC_SMALL_FAST_MODEL=moonshotai/kimi-k2.7-code
Essas variáveis de ambiente duram apenas na sessão atual. Para configuração permanente no Windows, adicione-as através de Propriedades do Sistema → Variáveis de Ambiente.
O que cada variável faz
| Variável | Valor | Finalidade |
|---|---|---|
ANTHROPIC_BASE_URL |
https://api.novita.ai/anthropic |
Aponta o Claude Code para o endpoint compatível com Anthropic da Novita AI |
ANTHROPIC_AUTH_TOKEN |
Sua chave de API da Novita | Autentica suas requisições |
ANTHROPIC_MODEL |
moonshotai/kimi-k2.7-code |
Define o modelo principal para tarefas de codificação |
ANTHROPIC_SMALL_FAST_MODEL |
moonshotai/kimi-k2.7-code |
Define o modelo para subtarefas leves |
Passo 4: Inicie o Claude Code
Navegue até o diretório do seu projeto e inicie uma sessão:
cd your-project-directory
claude .
O Claude Code abre um prompt interativo. Agora você pode descrever tarefas em inglês simples — implementar um recurso, corrigir um bug, refatorar um módulo, escrever testes — e o Kimi K2.7 Code lida com o raciocínio e a geração de código através do endpoint da Novita AI.
Para verificar se o modelo está roteando corretamente, execute /status dentro da sessão do Claude Code. Ele deve mostrar a URL base configurada e o modelo.
Dicas Práticas de Fluxo de Trabalho de Codificação
Envie mais contexto antecipadamente. Com 256K tokens disponíveis, você pode incluir o conteúdo completo de arquivos relevantes em vez de apenas trechos. O Claude Code pode referenciar o código real em vez de raciocinar a partir de resumos, o que reduz alucinações em detalhes de implementação.
Use pensamento intercalado para tarefas complexas. O Kimi K2.7 Code raciocina passo a passo antes de gerar código. Para refatorações em vários arquivos ou decisões de arquitetura, forneça ao modelo contexto suficiente para ver o panorama completo — ele planejará antes de escrever, o que reduz correções posteriores.
Depuração multimodal. O Kimi K2.7 Code aceita imagens e vídeos como entrada. Se seu fluxo de trabalho inclui relatórios de bugs baseados em capturas de tela ou tarefas de revisão de UI, você pode enviá-los diretamente para a sessão. As respostas são sempre em texto, então a saída é código, planos ou análise.
Prompts de sistema com cache intenso. Se você usa um prompt de sistema consistente em muitas sessões — padrões de codificação, convenções do projeto, notas de arquitetura — o preço de cache de leitura da Novita AI a $0,19 por milhão de tokens entra em ação em conteúdo repetido. Para equipes com prompts de sistema longos e estáveis, isso reduz significativamente o custo por tarefa.
Mantenha um modelo para consistência. Definir tanto ANTHROPIC_MODEL quanto ANTHROPIC_SMALL_FAST_MODEL para moonshotai/kimi-k2.7-code mantém o comportamento consistente entre a tarefa principal e as subtarefas. Se depois você quiser um modelo mais leve para subtarefas para economizar custos, pode trocar apenas ANTHROPIC_SMALL_FAST_MODEL.
Solução de Problemas
401 Não Autorizado
Sua chave de API está incorreta ou expirou. Verifique a chave em Gerenciamento de Chaves Novita AI. Verifique espaços extras ou quebras de linha ao copiar a chave.
Modelo não encontrado / 404
Confirme se o ID do modelo é exatamente moonshotai/kimi-k2.7-code — sem espaços extras, capitalização correta. Você pode verificar na página do modelo Kimi K2.7 Code.
Respostas lentas em prompts longos
Habilite o streaming por padrão no Claude Code — a maioria das configurações faz isso automaticamente. Para entradas de contexto muito longas (100K+ tokens), a latência da resposta inicial aumenta. Considere aparar o contexto de baixa prioridade primeiro.
Variáveis de ambiente não reconhecidas
No Mac/Linux, confirme que você executou o arquivo de perfil após editá-lo (source ~/.zshrc). No Windows, variáveis de ambiente definidas via set duram apenas na sessão atual do Prompt de Comando — use o painel Propriedades do Sistema para variáveis persistentes.
FAQ (Perguntas Frequentes)
O Kimi K2.7 Code funciona com o uso de ferramentas e integrações MCP do Claude Code?
Sim. O Kimi K2.7 Code suporta chamadas de função através do endpoint compatível com Anthropic da Novita AI, que é o que o Claude Code usa para chamadas de ferramentas e integrações MCP.
Por que usar o endpoint Anthropic em vez do compatível com OpenAI?
O Claude Code é construído no SDK da Anthropic. Ele se comunica usando o formato de mensagem da Anthropic, não da OpenAI. O endpoint https://api.novita.ai/anthropic da Novita AI traduz esse formato, então o Claude Code funciona sem qualquer modificação.
Como o Kimi K2.7 Code se compara ao Kimi K2.5 para o Claude Code?
O Kimi K2.7 Code gera aproximadamente 30% menos tokens de pensamento do que o K2.6 (e melhora a eficiência do K2.5), mantendo a qualidade de codificação. Para sessões do Claude Code com tarefas repetidas de várias etapas, menos tokens de pensamento significa respostas mais rápidas e menor custo de token por tarefa.
Posso usar esta configuração no VS Code ou Cursor?
Sim. O Claude Code se integra com VS Code e Cursor através de plugins e do terminal. A mesma configuração de variáveis de ambiente se aplica — uma vez definida, tanto as integrações de IDE quanto o terminal autônomo usam o modelo configurado.
Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de acessar modelos de última geração através de uma API simples, com infraestrutura de GPU acessível e confiável.
