GLM-4.7 na Novita AI: Codificação Agêntica de Longo Contexto via API

Índice

O que é o GLM-4.7?
Por que o GLM-4.7 na Novita AI
Funcionalidades e Benchmarks do GLM-4.7
Primeiros Passos com o GLM-4.7 na Novita AI
Padrões de Produção
Conclusão

O GLM-4.7 já está disponível na plataforma Novita AI, trazendo o mais recente modelo de texto flagship da Z.AI para uma API serverless pronta para produção e compatível com a OpenAI. O GLM-4.7 é otimizado para codificação agêntica, planejamento de longo prazo e fluxos de trabalho com uso de ferramentas, com maior confiabilidade no fluxo “pensar → agir” e estética de front-end significativamente aprimorada para entrega de produtos reais.

Na Novita AI, você pode executar o GLM-4.7 com contexto de 204.800 tokens, saída de até 131.072 tokens, quantização fp8 e suporte nativo para Chamada de Funções e Saída Estruturada.

Experimente o GLM 4.7 agora！

O que é o GLM-4.7?

O GLM-4.7 é o mais recente modelo de texto flagship da Z.AI, com atualizações importantes focadas em codificação avançada, planejamento de tarefas de longo alcance e colaboração com ferramentas mais confiável — projetado para concluir tarefas de ponta a ponta, em vez de apenas gerar snippets de código isolados.

Especificações principais (oficiais):

Janela de contexto: 200K tokens
Saída máxima: 128K tokens
Funcionalidades: modos de pensamento, streaming, chamada de funções, cache de contexto, saída estruturada (JSON) e integração com ferramentas/fontes de dados MCP

💡O que você obtém na Novita AI (serverless pronta para produção):

Item Detalhes

Modelo GLM-4.7

Comprimento do contexto 204.800

Saída máxima 131.072

Quantização fp8

Chamada de Funções / Saída Estruturada Suportado

Experimente o GLM 4.7 agora！


Item	Detalhes
Modelo	GLM-4.7
Comprimento do contexto	204.800
Saída máxima	131.072
Quantização	fp8
Chamada de Funções / Saída Estruturada	Suportado

Por que o GLM-4.7 na Novita AI

Preços serverless transparentes (pague por token)

Na Novita AI, o GLM-4.7 é executado como um endpoint serverless com faturamento claro por token:

Entrada: $0,6 / 1M tokens
Leitura de Cache: $0,11 / 1M tokens
Saída: $2,2 / 1M tokens

Essa linha de Leitura de Cache é importante: ela permite fluxos de trabalho de longo prazo com custo-benefício (pense em “um agente trabalhando em um repositório/especificação grande por várias turnos”). Clique aqui para saber mais informações sobre os preços.

API compatível com a OpenAI para integração instantânea

Se você já usa as APIs no estilo Chat Completions da OpenAI, pode migrar definindo a URL base da Novita e alterando o nome do modelo — nenhum novo protocolo para aprender.

Projetado para entrega agêntica

A Z.AI posiciona o GLM-4.7 em torno da “conclusão de tarefas”, com maior cumprimento de instruções durante o uso de ferramentas e estabilidade aprimorada para loops de agente complexos.

Funcionalidades e Benchmarks do GLM-4.7

O GLM-4.7 é projetado com foco em codificação agêntica (entrega de tarefas de ponta a ponta), raciocínio mais forte com pensamento controlável e fluxos de trabalho com uso de ferramentas mais confiáveis — com um salto notável na qualidade de geração de web/UI (“codificação de vibe”).

Funcionalidades

Codificação Agêntica, de ponta a ponta: melhor em planejar, implementar e iterar em projetos de vários arquivos e frameworks de agente reais.
Pensar antes de agir (agentes mais estáveis): cumprimento de instruções aprimorado e estabilidade em tarefas complexas; suporta controle por nível de turno para equilibrar custo/latência vs. confiabilidade.
Uso de Ferramentas e Navegação Web: padrões de execução de ferramentas mais fortes e tarefas no estilo de navegação.
Aperfeiçoamento de Raciocínio Complexo: ganhos mensuráveis em avaliações de raciocínio difícil (incluindo configurações aumentadas com ferramentas).
Codificação de Vibe (qualidade de UI e slides): páginas web modernas mais limpas e slides/leiautes com melhor aparência.

Benchmarks Padronizados

As pontuações a seguir são reportadas pela Z.AI:


Categoria	Benchmark	GLM-4.7
Codificação (correção de bugs real)	SWE-bench Verified	73,8
Agêntica / terminal	Terminal Bench 2.0	41,0
Codificação (ao vivo)	LiveCodeBench v6	84,9
Uso de ferramentas (interativo)	τ²-Bench	87,4
Navegação Web	BrowseComp	52,0 (e 67,5 com gerenciamento de contexto)
Raciocínio (ferramentas)	HLE (com Ferramentas)	42,8

Sinal de “Preferência Humana” do LMArena

Os rankings do LMArena são baseados em votos cegos de usuários e são um complemento útil de “como é a experiência” para os benchmarks.

Leaderboard WebDev: o GLM-4.7 está em #6 com Pontuação 1447 (+10/-10), 4.833 votos (última atualização em 16 de jan de 2026).
Arena de Texto (Geral): o GLM-4.7 está em #18 com Pontuação 1443 (±7), 8.258 votos (última atualização em 12 de jan de 2026).

🏆Posicionamento de modelo aberto: em ambos os leaderboards, os modelos classificados acima do GLM-4.7 têm licenças Proprietárias, enquanto o GLM-4.7 é MIT — tornando-o o modelo de licença aberta mais bem classificado nas categorias WebDev e Texto (Geral) no momento das atualizações desses leaderboards.

Primeiros Passos com o GLM-4.7 na Novita AI

Opção A: Use o Playground

A maneira mais fácil de conhecer o GLM-4.7 é testá-lo diretamente no Playground da Novita AI. Você pode começar a interagir com o GLM-4.7 instantaneamente no Playground da Novita AI — sem configuração, sem código. Basta se inscrever, abrir o Playground e testar prompts em tempo real. Novas contas recebem créditos gratuitos após o registro, então você pode testar o modelo imediatamente.

Acesse o Playground！

Opção B: Integre via API

Conecte o GLM-4.6V aos seus aplicativos usando a API REST unificada da Novita AI.

Como Obter Sua Chave de API na Novita AI

Passo 1: Crie ou Faça Login na Sua Conta Visite [https://novita.ai](https://novita.ai) e se inscreva ou faça login na sua conta existente
Passo 2: Acesse o Gerenciamento de Chaves Após fazer login, encontre “Chaves de API”
Passo 3: Crie uma Nova Chave Clique no botão “Adicionar Nova Chave”.
Passo 4: Salve Sua Chave Imediatamente Copie e armazene a chave assim que ela for gerada; geralmente ela é exibida apenas uma vez e não pode ser recuperada posteriormente. Guarde a chave em um local seguro, como um gerenciador de senhas ou notas criptografadas

Integração Direta via API

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="zai-org/glm-4.7",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=131072,
    temperature=0.7
)

print(response.choices[0].message.content)

Fluxos de Trabalho Multi-Agente com o OpenAI Agents SDK

Construa sistemas de agente sofisticados com integração plug-and-play — suportando transferências, roteamento e uso de ferramentas via chamada de funções nativa, além da janela de contexto completo para tarefas complexas de múltiplos passos.

Opção C: Conecte com Plataformas de Terceiros

Se você já está construindo com frameworks de agente ou ferramentas de desenvolvedor, a Novita AI foi projetada para se conectar com atrito mínimo:

Frameworks de agente e construtores de apps: Siga os guias de integração passo a passo da Novita para conectar com ferramentas populares como Continue, AnythingLLM, LangChain e Langflow.
Hugging Face Hub: a Novita está listada como um Provedor de Inferência no Hugging Face, então você pode executar modelos suportados por meio do fluxo de trabalho e ecossistema de provedores do Hugging Face.
API compatível com a OpenAI: os endpoints de LLM da Novita são compatíveis com o padrão de API da OpenAI, facilitando a migração de aplicativos existentes no estilo OpenAI e a conexão com muitas ferramentas compatíveis com a OpenAI ( Cline, Cursor, Trae e Qwen Code) .
API compatível com a Anthropic (fluxos de trabalho do Claude Code): a Novita também fornece acesso compatível com o SDK da Anthropic para que você possa integrar modelos suportados pela Novita em fluxos de trabalho de codificação agêntica no estilo Claude Code.
OpenCode (provedor integrado): a Novita AI agora está integrada diretamente ao OpenCode como um provedor suportado, então os usuários podem selecionar a Novita no OpenCode sem configuração manual.

Padrões de Produção

Use o Cache de Prompt para agentes de longo prazo Se você executar fluxos de trabalho de múltiplos turnos em um contexto grande e estável (snapshot de repositório, especificação longa, documento de design), o cache pode reduzir significativamente os custos — a Novita expõe o preço de Leitura de Cache explicitamente.
Saída Estruturada para pipelines confiáveis Ao integrar com motores de fluxo de trabalho, validadores ou UIs, prefira saídas estruturadas em JSON (baseadas em esquema) para reduzir casos de borda de parsing. A Novita lista a Saída Estruturada como suportada para o GLM-4.7.
Chamada de Funções para codificação aumentada com ferramentas Envolva suas ferramentas como funções: busca em repositório, consulta de tickets, acionamento de CI, leitura de banco de dados, busca na web — depois deixe o modelo decidir quando chamá-las. O GLM-4.7 é explicitamente projetado para colaboração mais forte com ferramentas.
Política de modo de pensamento: “rápido por padrão, profundo quando necessário”

Perguntas e respostas triviais / formatação: pensamento desligado
Depuração / refatorações de múltiplos passos: pensamento ligado
Tarefas longas: considere modos que melhoram a estabilidade e a taxa de acerto do cache

Conclusão

O GLM-4.7 traz um conjunto prático de atualizações para desenvolvedores que constroem codificação agêntica e fluxos de trabalho de uso de ferramentas de longo prazo: contexto de 200K, pensamento controlável, comportamento de chamada de funções mais forte e saídas de “codificação de vibe” de front-end melhores.

Na Novita AI, você pode começar imediatamente com uma API serverless compatível com a OpenAI, com preços de token transparentes e suporte nativo para chamada de funções e saídas estruturadas — pronta para pipelines de agente de nível de produção.

Mais Informações sobre o GLM 4.7

Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer nuvem de GPU acessível e confiável para construção e escalonamento.

Perguntas Frequentes

O que é o GLM-4.7?

O GLM-4.7 é o LLM flagship da Z.AI, posicionado para programação aprimorada e raciocínio/execução de múltiplos passos mais estável, e é lançado com um modelo oficial de pesos abertos (disponível no Hugging Face).

O GLM-4.7 é gratuito?

Na Novita AI, o GLM-4.7 é pago por token: $0,6/M tokens (entrada), $0,11/M tokens (leitura de cache) e $2,2/M tokens (saída) Na Z.ai, o acesso é geralmente disponibilizado por meio de um Plano de Codificação pago (a partir de $3/mês). Algumas plataformas podem oferecer testes/quotas limitadas como a Novita AI, mas o próprio GLM-4.7 não é “gratuito” de forma universal.

O GLM-4.7 é realmente bom?

Para fluxos de trabalho de codificação + agênticos, ele é posicionado como um modelo aberto de primeira linha por seu editor. A Z.AI relata resultados fortes em benchmarks de codificação e agentes (ex: LiveCodeBench v6, SWE-bench Verified, BrowseComp, τ²-Bench), e o enquadra como competitivo com o Claude Sonnet 4.5 em várias medições.

GLM-4.7 na Novita AI: Codificação Agêntica de Longo Contexto via API

O que é o GLM-4.7?

Por que o GLM-4.7 na Novita AI

Preços serverless transparentes (pague por token)