Principais Destaques
GPT-OSS-120B : Um modelo MoE de peso aberto com 117 bilhões de parâmetros desenvolvido pela OpenAI, projetado para raciocínio de nível empresarial e implantação em produção com desempenho próximo ao do o4-mini.
GLM-4.5 : Um modelo base que unifica recursos de raciocínio, codificação e agentes inteligentes para atender às demandas complexas de aplicações de agentes inteligentes.
A Novita AI não apenas oferece serviços de API estáveis, mas também preços extremamente competitivos. Por exemplo, o GPT-OSS-120B custa $0,1 por 1 milhão de tokens de entrada e $0,5 por 1 milhão de tokens de saída, enquanto o GLM-4.5 custa $0,6 por 1 milhão de tokens de entrada e $2,2 por 1 milhão de tokens de saída.
Introdução Básica do Modelo
GPT-OSS-120B
O gpt-oss-120B é um modelo de linguagem de peso aberto do tipo Mixture-of-Experts (MoE) desenvolvido pela OpenAI, com foco em raciocínio poderoso, aplicações agenticas e implantação escalável. Ele foi projetado para uso empresarial de alto desempenho e para desenvolvedores, atingindo desempenho quase equivalente ao do modelo o4-mini da OpenAI nos principais benchmarks de raciocínio, além de ser econômico e acessível.
- Parâmetros: 117 bilhões de parâmetros totais, com 5,1 bilhões de parâmetros ativos por etapa de inferência.
- Arquitetura: Projeto do tipo Mixture-of-Experts com 128 especialistas distribuídos em 36 camadas, utilizando ativações SwiGLU. Um sistema de roteamento de especialistas eficiente ativa apenas o subconjunto mais relevante de especialistas para cada token, permitindo maior especialização e eficiência. Conta com attention sinks aprendidas por cabeça de atenção para melhorias de desempenho.
- Janela de Contexto: Suporta uma janela de contexto de 128K tokens, permitindo raciocínio com textos longos, diálogos multir turno e manipulação de documentos extensos ou bases de código.
- Recursos Agênticos: Suporte nativo a chamadas de função, navegação na web, execução de código Python e saídas estruturadas, tornando-o adequado para a construção de agentes inteligentes. Compatível com os formatos de API de resposta da OpenAI e ajustável para casos de uso personalizados.
GLM-4.5
O GLM-4.5 é um modelo base projetado para agentes inteligentes, com 355 bilhões de parâmetros totais e 32 bilhões de parâmetros ativos. O modelo unifica recursos de raciocínio, codificação e agentes inteligentes para atender às demandas complexas de aplicações de agentes inteligentes. O GLM-4.5 é um modelo de raciocínio híbrido que oferece dois modos: modo de pensamento para raciocínio complexo e uso de ferramentas, e modo sem pensamento para respostas imediatas.
Principais Características e Arquitetura
- Parâmetros: 355 bilhões de parâmetros totais, com 32 bilhões de parâmetros ativos.
- Raciocínio Híbrido: Dois modos operacionais - modo de pensamento para raciocínio complexo e uso de ferramentas, e modo sem pensamento para respostas imediatas.
- Versões do Modelo: Disponível em modelos base, modelos de raciocínio híbrido e versões FP8.
- Janela de Contexto: 128K tokens.
- Licenciamento: Licença open source MIT para uso comercial e desenvolvimento secundário.
- Recursos: Funcionalidades unificadas de raciocínio, codificação e agentes inteligentes para aplicações complexas.
Comparação de Benchmarks entre GPT-OSS-120B e GLM-4.5
1. Benchmarks de Inteligência

2. Janela de Contexto:
GPT OSS 120B: 128K Tokens
GLM-4.5: 128K Tokens
3. Preços da API:
GPT OSS 120B: $0,1 / $0,5 entrada/saída por 1M de tokens
GLM-4.5: $0,6 / $2,2 entrada/saída por 1M de tokens
Teste de Habilidades Aplicadas do GPT-OSS-120B e GLM-4.5
1. GPT-OSS-120B vs GLM-4.5: Qual é melhor para geração de código?
Descrição da Tarefa: Implemente uma classe Python SmartQueue com as seguintes funcionalidades:
- Suportar operações de fila de prioridade (números menores = maior prioridade)
- Suportar operações em lote (adicionar/remover múltiplos elementos de uma vez)
- Implementar um método inteligente
auto_process()que processa automaticamente os N itens de maior prioridade - Incluir rastreamento de estatísticas básicas (contagem total de itens processados, tamanho atual da fila)
Requisitos Específicos:
# Expected usage example:
queue = SmartQueue()
queue.add_task("task1", priority=2)
queue.add_batch([("task2", 1), ("task3", 3), ("task4", 1)])
print(queue.get_stats()) # Returns statistics dictionary
processed = queue.auto_process(count=2) # Process top 2 highest-priority tasks
print(processed) # Returns list of processed tasks
Dimensões de Avaliação:
- Escolha da Estrutura de Dados: Se estruturas de dados apropriadas (ex: heapq) são selecionadas
- Design da API: Razoabilidade dos nomes de métodos e design de parâmetros
- Tratamento de Erros: Tratamento de casos de borda (fila vazia, parâmetros inválidos, etc.)
- Organização do Código: Estrutura da classe e lógica de implementação dos métodos
- Idiomas Python: Uso de recursos e convenções específicas do Python
- Eficiência do Algoritmo: Considerações de complexidade de tempo para as operações
Desafio Adicional: O método auto_process() deve retornar os itens processados em um formato significativo e atualizar as estatísticas internas.
GPT-OSS-120B

GLM 4.5

GLM 4.5: Adequado para aprendizado e protótipos simples, necessita de otimização para uso em produção
GPT OSS 120B: Pronto para projetos profissionais, atende aos padrões de qualidade de código industrial
Experimente o GPT-OSS-120B e o GLM-4.5 você mesmo!
2. Como o GLM-4.5 lida com consultas ambíguas em comparação com o GPT-OSS-120B?
Prompt: “O banco ligou sobre o cheque. Ele estava insuficiente.”
Esta frase contém múltiplas ambiguidades. Por favor:
- Identifique todas as interpretações possíveis desta frase
- Classifique essas interpretações por probabilidade em um contexto moderno
- Explique seu processo de raciocínio para desambiguação
- Se você precisasse de contexto adicional para ter certeza, quais perguntas específicas você faria?
- Forneça uma resposta como se você estivesse ajudando alguém a entender o que provavelmente aconteceu
Seja explícito sobre seu processo de pensamento e quaisquer suposições que está fazendo.
GPT-OSS-120B

GLM 4.5

O GPT-OSS-120B demonstrou profundidade analítica superior e raciocínio sistemático, enquanto o GLM-4.5 mostrou melhor julgamento prático ao equilibrar minúcia e usabilidade.
O GPT-OSS-120B se destaca na desambiguação exaustiva, enquanto o GLM-4.5 prioriza clareza e orientação acionável.
Como Acessar o GPT-OSS-120B e o GLM-4.5 na Novita AI
Passo 1: Faça Login e Acesse a Biblioteca de Modelos
Faça login na sua conta e clique no botão Biblioteca de Modelos.

Experimente o GPT-OSS-120B e o GLM-4.5 agora!
Passo 2: Escolha Seu Modelo
Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Passo 3: Inicie Seu Teste Gratuito
Inicie seu teste gratuito para explorar as capacidades do modelo selecionado.

Passo 4: Obtenha Sua Chave de API
Para autenticar com a API, forneceremos uma nova chave de API para você. Acessando a página de “Configurações“, você pode copiar a chave de API conforme indicado na imagem.

Passo 5: Instale a API
Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.

Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o LLM da Novita AI. Este é um exemplo de uso da API de conclusões de chat para usuários de Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
O GPT-OSS-120B se destaca como uma solução pronta para produção, oferecendo profundidade analítica abrangente e raciocínio sistemático que atende aos padrões de qualidade de código industrial. Sua abordagem exaustiva para resolução de problemas o torna adequado para projetos profissionais que exigem documentação detalhada e análise rigorosa.
O GLM-4.5 se destaca como uma ferramenta de desenvolvimento e prototipagem, oferecendo respostas práticas e focadas no usuário com raciocínio simplificado. Ele equilibra minúcia com usabilidade, sendo ideal para ambientes de aprendizado e prototipagem rápida.
Perguntas Frequentes
O que é o GPT-OSS-120B?
O GPT-OSS-120B é um modelo MoE de peso aberto com 117 bilhões de parâmetros desenvolvido pela OpenAI, projetado para raciocínio de nível empresarial e implantação em produção com desempenho próximo ao do o4-mini.
Como realizar o ajuste fino de um modelo GLM?
Os modelos GLM podem ser implantados por meio de APIs oficiais em plataformas como a Novita AI, com instruções de configuração específicas variando de acordo com a versão do modelo e os requisitos de hardware.
O GPT-4o é open source?
Não, mas o GPT-OSS-120B é open source e tem desempenho comparável ao do GPT-4o, podendo ser usado na Novita AI.
Sobre a Novita AI
A Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer uma nuvem de GPU acessível e confiável para construção e escalonamento.
