A Novita AI tem o prazer de apresentar cinco modelos THUDM de alto desempenho, com excelência em matemática e programação**:** GLM-4-32B-0414, GLM-Z1-32B-0414, GLM-Z1-Rumination-32B-0414, GLM-4-9B-0414 e GLM-Z1-9B-0414. Para apoiar desenvolvedores e a comunidade de código aberto, GLM-4-9B-0414 e GLM-Z1-9B-0414 agora estão disponíveis com acesso gratuito à API!
A Novita AI lança com orgulho cinco modelos THUDM de alto nível: GLM-4-32B-0414, GLM-Z1-32B-0414, GLM-Z1-Rumination-32B-0414, GLM-4-9B-0414 e GLM-Z1-9B-0414.
O GLM-4-32B-0414, construído com 15T de dados de alta qualidade e alinhamento de preferência humana, lidera com fortes capacidades gerais e se destaca em seguir instruções, uso de ferramentas e QA de busca.
Para desenvolvedores que buscam alto desempenho ou soluções econômicas, a Novita AI agora oferece acesso gratuito à API para GLM-4-9B-0414 e GLM-Z1-9B-0414.
O que são os Modelos da Série GML-4?

A série GLM do THUDM demonstra forte desempenho técnico, especialmente em tarefas de matemática, programação e raciocínio.
- Os modelos de 32B (GLM-4-32B, GLM-Z1-32B, GLM-Z1-Rumination) oferecem um equilíbrio entre capacidades gerais e raciocínio profundo, com o GLM-Z1-Rumination especializado em resolução de problemas abertos e raciocínio aumentado por busca.
- Os modelos de 9B (GLM-4-9B, GLM-Z1-9B) são altamente otimizados para raciocínio matemático e desempenho geral de tarefas, alcançando uma relação desempenho-tamanho impressionante, ideal para implantações leves.
O GLM-4-32B-Base-0414 serve como base técnica para toda a série.
- Foi pré-treinado em 15T de dados de alta qualidade, incluindo dados sintéticos focados em raciocínio, estabelecendo uma base sólida para o manuseio de tarefas complexas.
- A otimização pós-treinamento envolveu alinhamento de preferência humana, melhorando a capacidade do modelo de oferecer experiências de diálogo naturais e alinhadas ao usuário.
A hierarquia clara de modelos atende a diferentes necessidades de desenvolvimento.
- Para raciocínio complexo, escrita profunda e análise interdisciplinar, recomenda-se o GLM-Z1-Rumination-32B.
- Para desempenho geral robusto, o GLM-4-32B é a escolha ideal.
- Para projetos com orçamento limitado ou operações em lote de grande escala (por exemplo, tradução, QA), os modelos gratuitos GLM-4-9B e GLM-Z1-9B oferecem um excelente equilíbrio custo-desempenho.
Benchmark do GLM-4-32B-0414

O que o GLM-4-32B-0414 faz de melhor
Seguimento de Instruções (IFEval):
O GLM-4-32B-0414 se destaca na compreensão e execução de instruções, alcançando a maior pontuação entre todos os modelos.
Capacidade de Uso de Ferramentas (BFCL-v3 / TAU-Bench):
O GLM-4-32B-0414 demonstra desempenho excepcional em tarefas de uso de ferramentas em vários setores (varejo, companhias aéreas), liderando ou empatando em primeiro lugar em cenários de turno único e múltiplos turnos.
Sua vantagem é especialmente proeminente no uso complexo de ferramentas em múltiplos turnos, superando o segundo melhor modelo em quase 10 pontos.
Perguntas e Respostas Baseadas em Busca (SimpleQA, HotpotQA):
O GLM-4-32B-0414 mostra fortes capacidades em QA de busca, alcançando a maior pontuação (88,1) no SimpleQA e quase igualando o GPT-4o-1120 no HotpotQA, enquanto supera significativamente o DeepSeek-V3-0324 e o Qwen2.5-Max.
Capacidade da Série GLM-4
Código vs Gemini 2.5 Flash
Como Acessar o Modelo da Série GLM-4?
Passo 1: Faça login e acesse a Biblioteca de Modelos
Faça login na sua conta e clique no botão Model Library.

Experimente o GLM-4 Demo Agora!
Passo 2: Escolha seu Modelo
Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Passo 3: Inicie seu Teste Gratuito
Comece seu teste gratuito para explorar as capacidades do modelo selecionado.

Passo 4: Obtenha sua Chave de API
Para autenticar com a API, forneceremos uma nova chave de API. Acessando a página “Settings“, você pode copiar a chave de API conforme indicado na imagem.

Passo 5: Instale a API
Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.

Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o Novita AI LLM. Este é um exemplo de uso da API de chat completions para usuários Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "thudm/glm-4-32b-0414"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Conclusão
O GLM-4-32B-0414 demonstra força excepcional em tarefas-chave de IA, desde a adesão a instruções até o uso complexo de ferramentas em múltiplos turnos. Suas capacidades equilibradas, combinadas com a otimização de diálogo ajustada, o tornam uma escolha ideal para desenvolvedores que precisam de modelos robustos e versáteis.
Com o suporte da Novita AI, explorar os modelos GLM nunca foi tão fácil. Mergulhe no model playground e veja o que o GLM-4 pode fazer.
Perguntas Frequentes
O que torna o GLM-4-32B-0414 especial em comparação com outros modelos?
O GLM-4-32B-0414 se destaca no seguimento de instruções, uso de ferramentas em múltiplos turnos e QA baseado em busca, apoiado por pré-treinamento extensivo e otimização de diálogo ajustada.
Posso testar o GLM-4-32B-0414 através da Novita AI?
Sim, o GLM-4-32B-0414 está disponível na Novita AI com preços competitivos de API, enquanto o GLM-4-9B e o GLM-Z1-9B são gratuitos para acesso.
Para quais tarefas os modelos da série GLM-4 são mais adequados?
O GLM-4-32B-0414 é ideal para tarefas que exigem raciocínio profundo, diálogo complexo e execução de instruções de alta precisão.
Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer a nuvem GPU acessível e confiável para construir e escalar.
