Com 754B parâmetros (40B ativos) e arquitetura especializada para fluxos de trabalho agênticos de longo horizonte, o GLM-5 é construído especificamente para o caso de uso que torna o Claude Code poderoso: sessões de codificação multi-etapas e com forte uso de chamada de ferramentas, que exigem raciocínio sustentado sobre milhares de linhas de código.
Este guia mostra como integrar o GLM-5 ao Claude Code por meio de provedores de API como a Novita AI, oferecendo acesso a inteligência de codificação de ponta a US$ 1,00/US$ 3,20 por milhão de tokens — uma fração dos custos de modelos proprietários. Seja depurando sistemas complexos, refatorando bases de código legadas ou criando recursos de vários arquivos, a janela de contexto de 200K+ do GLM-5 e suas capacidades comprovadas de agente o tornam um backend ideal para o Claude Code.
Por que o GLM-5 se Destaca em Tarefas de Codificação Agêntica
Antes de mergulhar na configuração, é essencial entender por que o GLM-5 é exclusivamente adequado para fluxos de trabalho do Claude Code. Diferente de modelos focados em chat, o GLM-5 foi treinado com ênfase explícita em engenharia de sistemas complexos e tarefas agênticas de longo horizonte — exatamente as cargas de trabalho que o Claude Code exige.
Desempenho Comprovado em Benchmarks Agênticos


A Taxa de Sucesso de Build de Frontend (98%) indica que o GLM-5 se comporta mais como um modelo de “execução de engenharia”, ou seja, é altamente capaz de produzir resultados que podem realmente ser executados com sucesso em ambientes de desenvolvimento reais.
Arquitetura Otimizada para Geração de Código
- Atenção Esparsa DeepSeek (DSA): Lida eficientemente com janelas de contexto de 200K+, crucial para consciência no nível do repositório
- Corpus de treinamento de 28,5T tokens: Maior e mais diverso que os 23T tokens do GLM-4.5, melhorando o reconhecimento de padrões de código
- Aprendizado por reforço via
slime: Infraestrutura de RL assíncrona ajustou o modelo especificamente para precisão em chamada de ferramentas e coerência em múltiplas interações
Suporte a Chamada de Ferramentas e Funções
O GLM-5 inclui suporte nativo a --tool-call-parser glm47 (verificado na documentação de implantação do vLLM e SGLang), o que significa que ele pode:
- Analisar e executar chamadas de função estruturadas sem alucinar sintaxe
- Manter a precisão da chamada de ferramentas em mais de 10 etapas sequenciais
- Lidar de forma confiável com as ferramentas
Read,Write,EditeBashdo Claude Code
Comparação de ROI do Vending Bench 2
| Modelo | Saldo Final em Dinheiro (≈ Dia 365) | Custo | ROI = Saldo / Custo |
|---|---|---|---|
| Gemini 3 Pro | 5300 | 5478.16 | 0.97 |
| Claude Opus 4.5 | 4950 | 4967.06 | 1.00 |
| GLM-5 | 4350 | 4432.12 | 0.98 |
| GPT-5.2 | 3550 | 3591.33 | 0.99 |
| GLM-4.7 | 2350 | 2376.82 | 0.99 |
| Kimi K2.5 | 1150 | 1198.46 | 0.96 |
O GLM-5 é um modelo agêntico de alta execução e alto retorno, mas alcança isso por meio de alto custo computacional/uso de ferramentas. É essencialmente um agente orientado a engenharia do tipo “pague mais, ganhe mais”.
O que é o Claude Code?
Claude Code é o assistente de codificação agêntico da Anthropic, disponível como um aplicativo desktop (macOS/Linux). Ele combina um editor semelhante ao VS Code com um agente de IA que entende o terminal, capaz de ler arquivos, escrever código, executar comandos e iterar em tarefas de forma autônoma. Pense nele como “Cursor com acesso total ao terminal + execução de tarefas em múltiplas etapas”.
Principais pontos fortes:
- Integração profunda com o terminal (pode executar
npm install,git commit,pytest, etc. diretamente) - Estado persistente do espaço de trabalho entre sessões
- Mais de 10 ferramentas especializadas (Glob, Grep, WebFetch, Edit com substituição exata de string)
- Suporte ao MCP (Model Context Protocol) para plugins de ferramentas personalizados
Casos de Uso
| Caso de Uso | Cenário |
|---|---|
| Refatoração de Sistemas Complexos | Migrando um monolito para microsserviços em mais de 50 arquivos |
| Fluxos de Trabalho Intensivos em Terminal | Implantando um stack Docker, executando migrações, depurando K8s |
| Sessões de Depuração Profunda | Rastreando segfaults, analisando core dumps, corrigindo condições de corrida |
| Automação de Fluxo de Trabalho Personalizado | Integrando o GLM-5 com servidores MCP (Slack, GitHub, Notion) |
Como Usar o GLM-5 no Claude Code: Guia Completo de Configuração
O Claude Code suporta modelos personalizados por meio de endpoints de API compatíveis com OpenAI. Usaremos a Novita AI como provedora, pois ela oferece hospedagem sem servidor do GLM-5 com preços transparentes (US$ 1,00/US$ 3,20 por milhão de tokens).
Etapa 1: Obtenha sua Chave de API da Novita AI
- Acesse novita.ai
- Cadastre-se ou faça login em sua conta
- Navegue até Chaves de API (API Keys) no painel
- Clique em Criar Nova Chave e copie a chave
- Armazene-a com segurança — você precisará dela para as variáveis de ambiente

Etapa 2: Instale o Claude Code
#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash
#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex
#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
Windows requer Git for Windows. Instale-o primeiro caso não tenha.
Etapa 3: Configure as Variáveis de Ambiente
O Claude Code lê a configuração das variáveis de ambiente. Defina-as em seu perfil de shell:
Para macOS/Linux:
# Define o endpoint de API compatível com o SDK da Anthropic fornecido pela Novita.
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# Define o modelo fornecido pela Novita.
export ANTHROPIC_MODEL="zai-org/glm-5"
export ANTHROPIC_SMALL_FAST_MODEL="zai-org/glm-5"
Para Windows:
# Adicione ao seu perfil do PowerShell
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Novita API Key"
$env:ANTHROPIC_MODEL = "zai-org/glm-5"
$env:ANTHROPIC_SMALL_FAST_MODEL = "zai-org/glm-5"
Importante: A variável ANTHROPIC_SMALL_FAST_MODEL é usada para tarefas rápidas (navegação em arquivos, pesquisa).
Etapa 4: Inicie o Claude Code
Em seguida, navegue até o diretório do seu projeto e inicie o Claude Code. O Claude Code analisará o diretório atual do projeto e o usará como contexto de trabalho. Você verá o prompt do Claude Code em uma nova sessão interativa.
cd <seu-diretório-do-projeto>
claude .
Etapa 5: Use o Git com o Claude Code
O Claude Code torna as operações do Git conversacionais:
> quais arquivos eu alterei?
> comite minhas alterações com uma mensagem descritiva
Você também pode solicitar operações Git mais complexas:
> crie um novo branch chamado feature/quickstart
> mostre-me os últimos 5 commits
> ajude-me a resolver conflitos de merge
Dicas de Desempenho: Obtendo o Máximo do GLM-5
1. Aproveite ao Máximo as Janelas de Contexto
A janela de 200K+ do GLM-5 é uma grande vantagem. Em vez de pedir “corrija esta função”, carregue o módulo inteiro:
Prompt: "Leia todos os arquivos em src/auth/. Analise o fluxo de autenticação, identifique vulnerabilidades de segurança e proponha correções com exemplos de código."
2. Use Chamadas de Ferramentas Específicas
Oriente o GLM-5 para as ferramentas certas explicitamente quando necessário:
Prompt: "Use Grep para encontrar todas as ocorrências de 'deprecated_function' em toda a base de código e, em seguida, use Edit para substituí-las por 'new_function'."
3. Ative a Decodificação Especulativa (Para Auto-Hospedagem)
Se estiver executando o GLM-5 localmente via vLLM, use --speculative-config.method mtp para geração 30-50% mais rápida.
4. Encadeie Tarefas de Forma Incremental
Divida projetos complexos em blocos de 3 a 5 etapas:
Sessão 1: "Projete o esquema do banco de dados para uma plataforma de blogs. Crie modelos SQLAlchemy."
Sessão 2: "Implemente endpoints CRUD para postagens usando FastAPI."
Sessão 3: "Adicione middleware de autenticação e limitação de taxa."
A arquitetura MoE de 754B parâmetros, janela de contexto de 200K+ e treinamento especializado em engenharia de sistemas complexos tornam o modelo exclusivamente adequado para refatoração em nível de repositório, depuração multi-etapas e automação agêntica. Quer você escolha o Claude Code para fluxos de trabalho intensivos em terminal ou não, os benchmarks de desempenho e a eficiência de custo do GLM-5 o posicionam como uma escolha principal para ferramentas de IA voltadas a desenvolvedores em 2026.
Perguntas Frequentes
O GLM-5 pode ser executado localmente ou é necessário usar uma API?
O GLM-5 pode ser executado localmente via vLLM ou SGLang, mas requer 16 GPUs H100 80GB para quantização FP8. A hospedagem por API (Novita, OpenRouter) é mais prática para a maioria dos usuários.
Como o GLM-5 se compara ao DeepSeek V3 para codificação?
O GLM-5 pontua mais alto em benchmarks agênticos (Índice de Inteligência 50 vs. 45 do DeepSeek V3), enquanto o DeepSeek V3 é mais rápido para conclusão de código puro. Escolha o GLM-5 para tarefas multi-etapas.
O GLM-5 suporta chamada de funções e uso de ferramentas?
Sim — o GLM-5 inclui suporte nativo a --tool-call-parser glm47 e --enable-auto-tool-choice, verificado nos guias oficiais de implantação.
Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer uma nuvem de GPU acessível e confiável para construir e escalar.
Leitura Recomendada
Use o Qwen3-Coder-Next no Claude Code: Uma Alternativa 80% Mais Barata
[API do Kimi k2.5 para o Cursor: Guia do Desenvolvedor](http://Kimi k2.5 API for Cursor: Developer Guide)
