Desenvolvedores que criam assistentes de codificação autônomos enfrentam uma escolha crítica: pagar de US$ 3 a 15 por milhão de tokens de saída para modelos fechados como o Claude Sonnet 4.5, ou migrar para modelos de raciocínio abertos que prometem capacidades semelhantes a uma fração do custo. O Qwen3-235B-A22B-Thinking-2507, da Alibaba, desafia essa troca ao oferecer desempenho de raciocínio com o modo de “pensamento” dedicado — tudo por US$ 0,30/US$ 3,00 por 1M de tokens de entrada/saída via Novita AI.
Este guia mostra como integrar o Qwen3-235B-A22B-Thinking-2507 no Claude Code, o agente de terminal compatível com a Anthropic que permite fluxos de trabalho de codificação autônoma. Você verá como esse modelo MoE de 235B (22B de parâmetros ativos por token) aproveita o ambiente rico em ferramentas do Claude Code para automatizar tarefas de codificação complexas com traços de raciocínio estendidos.
Experimente o Qwen3-235B-A22B-Thinking-2507 agora!
O Qwen3-235B-A22B-Thinking-2507 oferece poder de raciocínio real?
O Qwen3-235B-A22B-Thinking-2507 é o modelo mais recente com capacidade de pensamento da linha Qwen3, oferecendo avanços significativos na capacidade de raciocínio. Ele se destaca na resolução de problemas lógicos, matemática, análise científica, codificação e avaliações acadêmicas — atingindo ou superando o desempenho de nível de especialista humano e oferecendo desempenho competitivo entre os modelos de raciocínio de código aberto. Além de seus pontos fortes em raciocínio, ele oferece capacidades gerais aprimoradas, incluindo seguimento de instruções mais preciso, integração avançada de ferramentas, geração de texto altamente natural e melhor alinhamento com a intenção humana. O modelo também suporta um contexto estendido de 131K tokens, permitindo o tratamento coerente e aprofundado de documentos longos e discussões complexas.
Arquitetura e Capacidades
| Parâmetro Técnico | Especificação | Descrição |
|---|---|---|
| Tipo de Modelo | Modelo de Linguagem Causal | Baseado na arquitetura Transformer |
| Total de Parâmetros | 235B | 22B parâmetros ativados |
| Parâmetros Não-Embedding | 234B | Parâmetros computacionais reais |
| Número de Camadas | 94 camadas | Estrutura de rede neural profunda |
| Cabeças de Atenção | Q: 64, KV: 4 | Usa mecanismo GQA |
| Número de Especialistas | 128 | Design de arquitetura MoE |
| Especialistas Ativados | 8 | Seleção dinâmica de especialistas |
| Comprimento do Contexto | 262.144 tokens | Suporte nativo a contexto longo |
Desempenho em Benchmark (Tarefas de Raciocínio)

Do Hugging Face
O Qwen3-235B-A22B-Thinking-2507 se destaca em tarefas pesadas de raciocínio e intensivas em conhecimento, particularmente matemática, conhecimento multilíngue e compreensão de documentos/vídeos. Seu desempenho é consistentemente competitivo com modelos maiores em benchmarks complexos de cognição e compreensão.
Custo e Eficiência de Tokens
A US$ 0,30 por 1M de tokens de entrada e US$ 3,00 por 1M de tokens de saída, o Qwen3-235B-A22B-Thinking-2507 oferece 90% de economia de custos na entrada e 80% de economia na saída em comparação com o Claude Sonnet 4.5 (US$ 3/US$ 15 por 1M de tokens). Para tarefas de raciocínio estendidas, o modelo pode gerar até 81K tokens — o que significa que uma única tarefa complexa pode custar US$ 0,24 em tokens de saída, contra US$ 1,22 com o Claude.

Experimente o Qwen3-235B-A22B-Thinking-2507 agora!
Por que o Qwen3-235B-A22B-Thinking-2507 funciona melhor com o Claude Code
O Claude Code é uma interface de codificação autônoma baseada em terminal publicada pela Anthropic. Ele orquestra fluxos de trabalho de várias etapas invocando ferramentas (edição de arquivos, comandos bash, busca), gerenciando o contexto entre tarefas e iterando com base no feedback. Os traços de raciocínio explícitos do Qwen3-235B-A22B-Thinking-2507 se alinham perfeitamente a esse paradigma autônomo — o modelo mostra suas etapas de planejamento antes de executar chamadas de ferramentas, tornando fluxos de trabalho complexos depuráveis e transparentes.
1. Otimizado para interações autônomas
O Qwen3-235B-A22B-Thinking-2507 foi projetado para realizar ações, usar ferramentas e gerenciar tarefas de várias etapas. Seu modo de pensamento gera cadeias de raciocínio estruturadas que correspondem à expectativa do Claude Code de fluxos de trabalho de planejamento → execução → verificação. Quando o modelo planeja uma refatoração em 5 arquivos, você vê o raciocínio passo a passo antes que qualquer edição de arquivo ocorra.
2. Cadeias de ferramentas ricas e suporte a API
O Claude Code fornece acesso pré-configurado a operações de sistema de arquivos, execução de bash, busca grep, comandos git e integrações com ferramentas externas. Os modelos Qwen3 suportam esquemas de chamada de ferramentas, modo JSON e definições de função — permitindo a invocação perfeita do conjunto de ferramentas do Claude Code para tarefas como testes automatizados, scripts de implantação e refatoração de vários arquivos.
3. Ciclos de feedback em tempo real
O modo de pensamento do modelo permite depuração adaptativa: se uma chamada de ferramenta falhar (por exemplo, erros no conjunto de testes), o traço de raciocínio mostra o que o modelo assumiu, permitindo que você corrija equívocos durante a sessão. Isso é fundamental para fluxos de trabalho autônomos, onde erros iniciais se propagam por mais de 20 etapas.
4. Saída estendida para raciocínio complexo
Tarefas do Claude Code como “refatorar o fluxo de autenticação em 8 arquivos” ou “depurar vazamento de memória com integração de profiler” exigem planos de várias etapas com saídas de mais de 10K tokens. O Qwen3-235B-A22B-Thinking-2507 suporta até 81K tokens para raciocínio complexo — superando amplamente os limites de modelos padrão — enquanto mantém os custos controlados (US$ 0,24 por 81K de saída contra US$ 1,22 para o Claude).
Como usar o Qwen3-235B-A22B-Thinking-2507 com o Claude Code
A Novita AI fornece um endpoint de API compatível com a Anthropic, o que significa que o Claude Code funciona com o Qwen3-235B-A22B-Thinking-2507 por meio de uma configuração simples de variáveis de ambiente — nenhuma alteração de código é necessária. A janela de contexto de 256K do modelo e o preço de US$ 0,30/US$ 3,00 por 1M de tokens de entrada/saída o tornam ideal para sessões de codificação estendidas.
Pré-requisitos — Obtenha a chave de API da Novita AI
Passo 1: Crie uma conta gratuita na Novita AI e faça login.
Passo 2: Acesse a Biblioteca de Modelos e pesquise por qwen/qwen3-235b-a22b-thinking-2507.
Passo 3: Clique em Iniciar Teste Gratuito para ativar o acesso (a Novita fornece créditos de teste para novos usuários).
Passo 4: Acesse Configurações → Chaves de API e clique em Gerar Chave de API. Copie a chave.
Passo 5: Verifique a conexão com a API com este teste em Python:
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="qwen/qwen3-235b-a22b-thinking-2507",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=32768,
temperature=0.7
)
print(response.choices[0].message.content)
Você verá a resposta do modelo com traços de raciocínio contidos em tags <think>.
Experimente o Qwen3-235B-A22B-Thinking-2507 agora!
Guia de Configuração do Claude Code
Passo 1: Instalando o Claude Code
#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash
#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex
#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
O Windows requer o Git para Windows. Instale-o primeiro se você não o tiver.
Passo 2: Configurando as Variáveis de Ambiente
O Claude Code usa 4 variáveis de ambiente para rotear solicitações de API para a Novita AI:
#Para macOS/Linux (Bash/Zsh):
# Define o endpoint de API compatível com a Anthropic fornecido pela Novita.
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# Define o modelo fornecido pela Novita.
export ANTHROPIC_MODEL="qwen/qwen3-235b-a22b-thinking-2507"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3-235b-a22b-thinking-2507"
#Para Windows (PowerShell):
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Novita API Key"
$env:ANTHROPIC_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"
$env:ANTHROPIC_SMALL_FAST_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"
Explicação:
ANTHROPIC_BASE_URL: Aponta o Claude Code para o endpoint compatível com a Anthropic fornecido pela NovitaANTHROPIC_AUTH_TOKEN: Sua chave de API da Novita (não uma chave da Anthropic)ANTHROPIC_MODEL: Modelo principal para tarefas complexas (modo de pensamento)ANTHROPIC_SMALL_FAST_MODEL: Modelo de fallback para operações rápidas (defina como o mesmo modelo se quiser um comportamento de raciocínio consistente)
Passo 3: Iniciando o Claude Code
Navegue até o diretório do seu projeto e inicie o Claude Code:
cd <your-project-directory>
claude .
Você verá o prompt do Claude Code dentro de uma sessão interativa. O modo de pensamento do modelo é ativado automaticamente para consultas complexas.
Exemplo de tarefa:
> Refactor the authentication module to use JWT tokens instead of sessions. Update all 5 related files and add unit tests.
O Claude Code analisará a solicitação, invocará o Qwen3-235B-A22B-Thinking-2507 para gerar um plano de várias etapas (visível em blocos <think>), depois executará edições de arquivos, escreverá testes e verificará as alterações.
Dica Pro: Para tarefas pesadas de matemática ou design de algoritmos, aumente o
max_tokenspara 131072 em suas chamadas de API para aproveitar a capacidade de raciocínio estendida do Qwen3-235B-A22B-Thinking-2507. Defina isso na configuração do Claude Code se ele expuser limites de tokens.
Experimente o Qwen3-235B-A22B-Thinking-2507 agora!
O Qwen3-235B-A22B-Thinking-2507 oferece raciocínio avançado, manipulação de contexto longo e planejamento estruturado de várias etapas a uma fração do custo de modelos fechados. Combinado com o Claude Code, ele permite fluxos de trabalho de codificação autônoma transparentes e depuráveis, tornando-se uma solução prática para desenvolvedores que buscam raciocínio de alto desempenho e automação de codificação sem despesas proibitivas de tokens.
Conclusão
O Qwen3-235B-A22B-Thinking-2507 traz raciocínio estendido, saída transparente de cadeia de pensamento e fortes capacidades de uso de ferramentas para o fluxo de trabalho autônomo do Claude Code — a uma fração do custo de modelos fechados. Para desenvolvedores que executam tarefas de codificação complexas, a combinação oferece tanto desempenho quanto eficiência orçamentária.
Principal Conclusão: Configure quatro variáveis de ambiente, aponte o Claude Code para o endpoint compatível com a Anthropic da Novita AI e você estará executando fluxos de trabalho de raciocínio avançado em minutos. Experimente o Qwen3-235B-A22B-Thinking-2507 na Novita AI e comece a construir hoje mesmo.
O que torna o Qwen3-235B-A22B-Thinking-2507 diferente dos modelos de codificação padrão?
É um modelo exclusivo de pensamento que gera traços de raciocínio estruturados em blocos <think> antes de gerar código, tornando fluxos de trabalho autônomos complexos transparentes e depuráveis. Ao contrário de modelos de instrução geral, ele é otimizado exclusivamente para tarefas pesadas de raciocínio, como programação competitiva, design de algoritmos e depuração de várias etapas.
Posso usar o Qwen3-235B-A22B-Thinking-2507 em ferramentas diferentes do Claude Code?
Sim — ele funciona com qualquer ferramenta que suporte APIs compatíveis com a OpenAI. O Trae (IDE com GUI), o OpenCode (agente de terminal), o Cursor (editor de código) e scripts personalizados em Python/Node.js todos o suportam por meio do endpoint https://api.novita.ai/v3/openai da Novita AI.
Preciso de uma GPU para executar o Qwen3-235B-A22B-Thinking-2507 localmente?
Sim — estimativa de 4×H100 80GB para FP8. Para a maioria dos desenvolvedores, a API da Novita AI é mais econômica do que o auto-hospedagem, a menos que você execute mais de 10.000 tarefas por mês.
Leituras Recomendadas
- Usar o GLM-4.5 no Trae para desbloquear agentes de codificação mais inteligentes
- Usar o Codex CLI com a Novita AI
- Usar o MiniMax M2.1 no OpenCode
Novita AI é uma plataforma de nuvem de IA e agentes que ajuda desenvolvedores e startups a construir, implantar e escalar modelos e aplicações autônomas com alto desempenho, confiabilidade e eficiência de custos.
