GPT-OSS-120B VS GLM-4.5: Prático ou Sistemático

GPT-OSS-120B VS GLM-4.5: Prático ou Sistemático

Principais Destaques

GPT-OSS-120B : Um modelo MoE de peso aberto com 117 bilhões de parâmetros desenvolvido pela OpenAI, projetado para raciocínio de nível empresarial e implantação em produção com desempenho próximo ao do o4-mini.

GLM-4.5 : Um modelo base que unifica recursos de raciocínio, codificação e agentes inteligentes para atender às demandas complexas de aplicações de agentes inteligentes.

A Novita AI não apenas oferece serviços de API estáveis, mas também preços extremamente competitivos. Por exemplo, o GPT-OSS-120B custa $0,1 por 1 milhão de tokens de entrada e $0,5 por 1 milhão de tokens de saída, enquanto o GLM-4.5 custa $0,6 por 1 milhão de tokens de entrada e $2,2 por 1 milhão de tokens de saída.

Introdução Básica do Modelo

GPT-OSS-120B

O gpt-oss-120B é um modelo de linguagem de peso aberto do tipo Mixture-of-Experts (MoE) desenvolvido pela OpenAI, com foco em raciocínio poderoso, aplicações agenticas e implantação escalável. Ele foi projetado para uso empresarial de alto desempenho e para desenvolvedores, atingindo desempenho quase equivalente ao do modelo o4-mini da OpenAI nos principais benchmarks de raciocínio, além de ser econômico e acessível.

  • Parâmetros: 117 bilhões de parâmetros totais, com 5,1 bilhões de parâmetros ativos por etapa de inferência.
  • Arquitetura: Projeto do tipo Mixture-of-Experts com 128 especialistas distribuídos em 36 camadas, utilizando ativações SwiGLU. Um sistema de roteamento de especialistas eficiente ativa apenas o subconjunto mais relevante de especialistas para cada token, permitindo maior especialização e eficiência. Conta com attention sinks aprendidas por cabeça de atenção para melhorias de desempenho.
  • Janela de Contexto: Suporta uma janela de contexto de 128K tokens, permitindo raciocínio com textos longos, diálogos multir turno e manipulação de documentos extensos ou bases de código.
  • Recursos Agênticos: Suporte nativo a chamadas de função, navegação na web, execução de código Python e saídas estruturadas, tornando-o adequado para a construção de agentes inteligentes. Compatível com os formatos de API de resposta da OpenAI e ajustável para casos de uso personalizados.

GLM-4.5

O GLM-4.5 é um modelo base projetado para agentes inteligentes, com 355 bilhões de parâmetros totais e 32 bilhões de parâmetros ativos. O modelo unifica recursos de raciocínio, codificação e agentes inteligentes para atender às demandas complexas de aplicações de agentes inteligentes. O GLM-4.5 é um modelo de raciocínio híbrido que oferece dois modos: modo de pensamento para raciocínio complexo e uso de ferramentas, e modo sem pensamento para respostas imediatas.

Principais Características e Arquitetura

  • Parâmetros: 355 bilhões de parâmetros totais, com 32 bilhões de parâmetros ativos.
  • Raciocínio Híbrido: Dois modos operacionais - modo de pensamento para raciocínio complexo e uso de ferramentas, e modo sem pensamento para respostas imediatas.
  • Versões do Modelo: Disponível em modelos base, modelos de raciocínio híbrido e versões FP8.
  • Janela de Contexto: 128K tokens.
  • Licenciamento: Licença open source MIT para uso comercial e desenvolvimento secundário.
  • Recursos: Funcionalidades unificadas de raciocínio, codificação e agentes inteligentes para aplicações complexas.

Comparação de Benchmarks entre GPT-OSS-120B e GLM-4.5

1. Benchmarks de Inteligência

2. Janela de Contexto:

GPT OSS 120B: 128K Tokens

GLM-4.5: 128K Tokens

3. Preços da API:

GPT OSS 120B: $0,1 / $0,5 entrada/saída por 1M de tokens

GLM-4.5: $0,6 / $2,2 entrada/saída por 1M de tokens

Teste de Habilidades Aplicadas do GPT-OSS-120B e GLM-4.5

1. GPT-OSS-120B vs GLM-4.5: Qual é melhor para geração de código?

Descrição da Tarefa: Implemente uma classe Python SmartQueue com as seguintes funcionalidades:

  1. Suportar operações de fila de prioridade (números menores = maior prioridade)
  2. Suportar operações em lote (adicionar/remover múltiplos elementos de uma vez)
  3. Implementar um método inteligente auto_process() que processa automaticamente os N itens de maior prioridade
  4. Incluir rastreamento de estatísticas básicas (contagem total de itens processados, tamanho atual da fila)

Requisitos Específicos:

# Expected usage example:
queue = SmartQueue()
queue.add_task("task1", priority=2)
queue.add_batch([("task2", 1), ("task3", 3), ("task4", 1)])
print(queue.get_stats())  # Returns statistics dictionary
processed = queue.auto_process(count=2)  # Process top 2 highest-priority tasks
print(processed)  # Returns list of processed tasks

Dimensões de Avaliação:

  • Escolha da Estrutura de Dados: Se estruturas de dados apropriadas (ex: heapq) são selecionadas
  • Design da API: Razoabilidade dos nomes de métodos e design de parâmetros
  • Tratamento de Erros: Tratamento de casos de borda (fila vazia, parâmetros inválidos, etc.)
  • Organização do Código: Estrutura da classe e lógica de implementação dos métodos
  • Idiomas Python: Uso de recursos e convenções específicas do Python
  • Eficiência do Algoritmo: Considerações de complexidade de tempo para as operações

Desafio Adicional: O método auto_process() deve retornar os itens processados em um formato significativo e atualizar as estatísticas internas.

GPT-OSS-120B

Desafio de codificação GPT OSS 120B

GLM 4.5

Desafio de codificação GLM4.5

GLM 4.5: Adequado para aprendizado e protótipos simples, necessita de otimização para uso em produção

GPT OSS 120B: Pronto para projetos profissionais, atende aos padrões de qualidade de código industrial

Experimente o GPT-OSS-120B e o GLM-4.5 você mesmo!

2. Como o GLM-4.5 lida com consultas ambíguas em comparação com o GPT-OSS-120B?

Prompt: “O banco ligou sobre o cheque. Ele estava insuficiente.”

Esta frase contém múltiplas ambiguidades. Por favor:

  1. Identifique todas as interpretações possíveis desta frase
  2. Classifique essas interpretações por probabilidade em um contexto moderno
  3. Explique seu processo de raciocínio para desambiguação
  4. Se você precisasse de contexto adicional para ter certeza, quais perguntas específicas você faria?
  5. Forneça uma resposta como se você estivesse ajudando alguém a entender o que provavelmente aconteceu

Seja explícito sobre seu processo de pensamento e quaisquer suposições que está fazendo.

GPT-OSS-120B

Consultas ambíguas gpt oss 120b

GLM 4.5

Consultas ambíguas GLM 4.5

O GPT-OSS-120B demonstrou profundidade analítica superior e raciocínio sistemático, enquanto o GLM-4.5 mostrou melhor julgamento prático ao equilibrar minúcia e usabilidade.

O GPT-OSS-120B se destaca na desambiguação exaustiva, enquanto o GLM-4.5 prioriza clareza e orientação acionável.

Como Acessar o GPT-OSS-120B e o GLM-4.5 na Novita AI

Passo 1: Faça Login e Acesse a Biblioteca de Modelos

Faça login na sua conta e clique no botão Biblioteca de Modelos.

Biblioteca de Modelos

Experimente o GPT-OSS-120B e o GLM-4.5 agora!

Passo 2: Escolha Seu Modelo

Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Escolha Seu Modelo

Passo 3: Inicie Seu Teste Gratuito

Inicie seu teste gratuito para explorar as capacidades do modelo selecionado.

escolha seu modelo

Passo 4: Obtenha Sua Chave de API

Para autenticar com a API, forneceremos uma nova chave de API para você. Acessando a página de “Configurações“, você pode copiar a chave de API conforme indicado na imagem.

obtenha sua chave de api

Passo 5: Instale a API

Instale a API usando o gerenciador de pacotes específico da sua linguagem de programação.

instale a api

Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o LLM da Novita AI. Este é um exemplo de uso da API de conclusões de chat para usuários de Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

O GPT-OSS-120B se destaca como uma solução pronta para produção, oferecendo profundidade analítica abrangente e raciocínio sistemático que atende aos padrões de qualidade de código industrial. Sua abordagem exaustiva para resolução de problemas o torna adequado para projetos profissionais que exigem documentação detalhada e análise rigorosa.

O GLM-4.5 se destaca como uma ferramenta de desenvolvimento e prototipagem, oferecendo respostas práticas e focadas no usuário com raciocínio simplificado. Ele equilibra minúcia com usabilidade, sendo ideal para ambientes de aprendizado e prototipagem rápida.

Perguntas Frequentes

O que é o GPT-OSS-120B?

O GPT-OSS-120B é um modelo MoE de peso aberto com 117 bilhões de parâmetros desenvolvido pela OpenAI, projetado para raciocínio de nível empresarial e implantação em produção com desempenho próximo ao do o4-mini.

Como realizar o ajuste fino de um modelo GLM?

Os modelos GLM podem ser implantados por meio de APIs oficiais em plataformas como a Novita AI, com instruções de configuração específicas variando de acordo com a versão do modelo e os requisitos de hardware.

O GPT-4o é open source?

Não, mas o GPT-OSS-120B é open source e tem desempenho comparável ao do GPT-4o, podendo ser usado na Novita AI.

Sobre a Novita AI
A Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer uma nuvem de GPU acessível e confiável para construção e escalonamento.