A Novita AI simplifica a execução de modelos abertos de ponta com inferência de GPU pronta para produção — sem gerenciar clusters, drivers ou dores de cabeça de escalonamento. Neste guia, mostraremos como usar o Qwen3.5-397B-A17B dentro do Claude Code roteando solicitações pela API da Novita AI, para que você mantenha o mesmo fluxo de trabalho de desenvolvedor enquanto substitui por um modelo Qwen poderoso para tarefas de codificação, refatoração e contexto longo. Se você quer melhor controle de custos, escolha flexível de modelos e uma configuração de “integração imediata” tranquila, este passo a passo é para você.
Experimente o Qwen3.5-397B-A17B Agora!
O que é o Qwen3.5-397B-A17B?
O Qwen3.5-397B-A17B é o modelo nativo multimodal (texto + imagem + vídeo na entrada, texto na saída) principal da família Qwen3.5, da Alibaba. Arquiteturalmente, é um modelo Híbrido de Mistura de Especialistas (MoE) com 397B de parâmetros totais, mas apenas ~17B ativados por token — um dos principais motivos pelos quais ele pode entregar capacidade de “nível de ponta” com eficiência de inferência muito melhor do que modelos densos de tamanho total semelhante.
Especificações-chave que importam para desenvolvedores:
- Comprimento de contexto: 262.144 tokens
- Entrada multimodal: suporta texto, imagem, vídeo (ótimo para fluxos de trabalho de agentes que precisam de capturas de tela de interface, logs, diagramas ou quadros de vídeo).
- Forte orientação para agentes + codificação: os destaques do Qwen3.5 enfatizam raciocínio, codificação e capacidades de agente como objetivos de primeira classe.
Se você está avaliando-o com benchmarks independentes e comparações entre provedores, o Artificial Analysis acompanha qualidade, velocidade e preço entre provedores para o Qwen3.5 397B A17B.
Por que usar o Qwen3.5-397B-A17B com o Claude Code?
O Claude Code é uma ferramenta de codificação agentiva que roda no seu terminal (e IDEs), lê sua base de código, edita arquivos, executa comandos e ajuda com fluxos de trabalho git. A documentação da Anthropic observa explicitamente que a CLI do Terminal e o VS Code suportam provedores terceiros, o que possibilita rotear solicitações do Claude Code para modelos que não são da Anthropic por meio de endpoints compatíveis.
Combinar o Qwen3.5-397B-A17B + Claude Code é especialmente interessante quando você quer:
- Codificação com contexto grande + refatorações sem perder a estrutura global: Com contexto nativo de 262K, o Qwen3.5 pode manter mais do seu repositório, logs, rastros de pilha e especificações “em mente” durante tarefas de múltiplas etapas — útil para migrações, refatorações de monorepositórios ou depuração de incidentes complexos.
- Fluxos de trabalho de agentes que incluem capturas de tela e artefatos de interface: Como o Qwen3.5 é nativamente multimodal, você pode alimentar capturas de tela de interface (ou diagramas gerados) no mesmo modelo que está escrevendo e editando código — útil para loops de “corrija este bug de layout” ou “recrie este componente de interface”.
- Experimentação de menor custo em escala (sem alterar seu fluxo de trabalho): Usando a API serverless da Novita AI, você pode chamar
qwen/qwen3.5-397b-a17bpagando por token e manter seus hábitos existentes do Claude Code (comandos de barra, varredura de repositório, alterações iterativas).
Como usar o Qwen3.5-397B-A17B no Claude Code
Antes de começar: API do Qwen3.5 da Novita AI (capacidades + preços)
A Novita fornece o Qwen3.5-397B-A17B como uma API serverless: você pode enviar solicitações imediatamente e pagar apenas pelo uso.
Na página do modelo você também pode confirmar o que vem pronto para uso:
- Comprimento de contexto: 262.144
- Saída máxima: 64.000
- Chamada de funções: Suportado
- Saída estruturada: Suportado
- Entrada: texto, imagem, vídeo (Saída: texto)
E os preços (serverless):
- Entrada: $0,6 / M tokens
- Saída: $3,6 / M tokens
Saiba Mais Sobre a API da Novita!
Passo 1: Obtendo sua chave de API na Novita AI
- Crie ou Faça Login na Sua Conta: Acesse https://novita.ai e cadastre-se ou faça login.
- Acesse o Gerenciamento de Chaves: Após fazer login, encontre “Chaves de API” no console/configurações.
- Crie uma Nova Chave: Clique em “Adicionar Nova Chave”.
- Salve Sua Chave Imediatamente: Copie e armazene a chave assim que for gerada (use um gerenciador de senhas / notas criptografadas).

Passo 2: Instalando o Claude Code
O Claude Code agora recomenda instaladores nativos:
- macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash
- PowerShell do Windows:
irm https://claude.ai/install.ps1 | iex
- CMD do Windows:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
Nota: No Windows, o Claude Code requer o Git para Windows (instale-o primeiro se você ainda não o tiver).
Verifique sua instalação
claude --version
Passo 3: Configurando Variáveis de Ambiente
- No Windows (CMD)
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Your_Novita_API_Key>
set ANTHROPIC_MODEL=qwen/qwen3.5-397b-a17b
set ANTHROPIC_SMALL_FAST_MODEL=qwen/qwen3.5-397b-a17b
- No macOS e Linux
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Your_Novita_API_Key>"
export ANTHROPIC_MODEL="qwen/qwen3.5-397b-a17b"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3.5-397b-a17b"
Passo 4: Iniciando o Claude Code
- Acesse o Diretório do Seu Projeto
cd <path_to_your_project>
- Inicie o Claude Code
claude .
O ponto (.) informa ao Claude Code para operar no diretório atual, varrendo e trabalhando dentro deste projeto. Você receberá um prompt interativo onde pode usar comandos como /init, /model, /review, etc. (Consulte a visão geral oficial para saber como o Claude Code opera entre arquivos/ferramentas.)
Uma Configuração, Vários Modelos
Se você quer alternar entre diferentes modelos de linguagem grandes no seu fluxo de trabalho de desenvolvimento (por exemplo, mudando de um modelo de “rascunho rápido” para um modelo de “raciocínio profundo”), você pode fazer isso sem alterar sua base de código.
A Novita AI torna isso especialmente simples ao oferecer APIs unificadas, com compatibilidade como prioridade — para que você possa testar vários modelos rapidamente e manter seu fluxo de trabalho estável.
Usando Variáveis de Ambiente
Se você está trabalhando com o Claude Code (ou qualquer ferramenta vinculada ao SDK da Anthropic), pode alternar modelos atualizando as variáveis de ambiente — nenhuma refatoração necessária.
No macOS/Linux:
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Your_Novita_API_Key>"
export ANTHROPIC_MODEL="qwen/qwen3-coder-next" # ← troque o modelo aqui
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3-coder-next"
No Windows (CMD):
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Your_Novita_API_Key>
set ANTHROPIC_MODEL=qwen/qwen3-coder-next # ← troque o modelo aqui
set ANTHROPIC_SMALL_FAST_MODEL=qwen/qwen3-coder-next
Para alternar modelos, basta substituir o valor de ANTHROPIC_MODEL por outro nome de modelo suportado (ex: deepseek/deepseek-v3.2, zai-org/glm-4.7, moonshotai/kimi-k2.5, etc.).

Conclusão
O Qwen3.5-397B-A17B combina eficiência MoE (397B totais / 17B ativos), contexto nativo de 262K e entradas nativamente multimodais — uma combinação forte para cargas de trabalho modernas de “codificação agentiva”.
Ao rotear o Claude Code pelo endpoint compatível com Anthropic da Novita AI, você pode manter o mesmo fluxo de trabalho nativo de terminal (planejar → editar → executar → iterar) enquanto aproveita os pontos fortes de contexto longo e multimodais do Qwen3.5 — geralmente com controle de custos mais flexível graças ao acesso serverless e pagamento por token da Novita.
A Novita AI é a plataforma de nuvem tudo-em-um que capacita suas ambições de IA. APIs integradas, serverless, Instâncias de GPU — as ferramentas econômicas que você precisa. Elimine infraestrutura, comece gratuitamente e torne sua visão de IA realidade.
Perguntas Frequentes
O que é o Qwen3.5-397B-A17B? O Qwen3.5-397B-A17B é um modelo de linguagem grande da família Qwen, projetado para tarefas de raciocínio e codificação de alta qualidade. Ele é construído para lidar com instruções complexas e geração de texto longo, sendo uma opção forte para fluxos de trabalho de desenvolvimento de software.
O que é o Claude Code? O Claude Code é uma ferramenta para desenvolvedores (da Anthropic) que permite usar um LLM para ajudar com tarefas de codificação diretamente no seu fluxo de trabalho — como entender uma base de código, gerar correções, refatorar, escrever testes e explicar código — geralmente por meio de uma experiência estilo CLI.
Como uso o Qwen3.5-397B-A17B no Claude Code com a Novita AI?
Você pode apontar o Claude Code para a API compatível com Anthropic da Novita AI definindo seu endpoint e chave de API nas variáveis de ambiente, depois selecionando Qwen3.5-397B-A17B como modelo. Isso permite executar o Qwen dentro do Claude Code sem alterar o código do seu projeto — basta alternar a configuração.
