Aspectos destacados clave
GPT-OSS-120B : Un modelo MoE de peso abierto de 117B parámetros desarrollado por OpenAI, diseñado para razonamiento de nivel empresarial y despliegue en producción con un rendimiento cercano al de o4-mini.
GLM-4.5 : Un modelo base que unifica capacidades de razonamiento, codificación y agentes inteligentes para satisfacer las demandas complejas de aplicaciones de agentes inteligentes.
Novita AI no solo ofrece servicios API estables, sino que también cuenta con precios muy económicos. Por ejemplo, GPT-OSS-120B cuesta $0.1 por 1M de tokens de entrada y $0.5 por 1M de tokens de salida, mientras que GLM-4.5 cuesta $0.6 por 1M de tokens de entrada y $2.2 por 1M de tokens de salida.
Introducción básica del modelo
GPT-OSS-120B
gpt-oss-120B es un modelo de lenguaje de Mixtura de Expertos (MoE) de peso abierto desarrollado por OpenAI, centrado en razonamiento potente, aplicaciones agénticas y despliegue escalable. Está diseñado tanto para uso empresarial de alto rendimiento como para desarrolladores, logrando una paridad casi total con el modelo o4-mini de OpenAI en los puntos de referencia de razonamiento básico, a la vez que sigue siendo rentable y accesible.
- Parámetros: 117 mil millones de parámetros totales con 5.1 mil millones de parámetros activos por paso de inferencia.
- Arquitectura: Diseño de Mixtura de Expertos con 128 expertos en 36 capas, que utiliza activaciones SwiGLU. Un sistema de enrutamiento de expertos eficiente activa solo el subconjunto de expertos más relevante para cada token, lo que permite una mayor especialización y eficiencia. Cuenta con sumideros de atención aprendidos por cabeza de atención para mejorar el rendimiento.
- Ventana de contexto: Admite una ventana de contexto de 128K tokens, lo que permite razonamiento de formato largo, diálogos multipaso y manejo de documentos extensos o bases de código.
- Capacidades agénticas: Soporte nativo para llamadas a funciones, navegación web, ejecución de código Python y salidas estructuradas, lo que lo hace adecuado para construir agentes inteligentes. Es compatible con los formatos de API de respuesta de OpenAI y se puede ajustar finamente para casos de uso personalizados.
GLM-4.5
GLM-4.5 es un modelo base diseñado para agentes inteligentes con 355 mil millones de parámetros totales y 32 mil millones de parámetros activos. El modelo unifica capacidades de razonamiento, codificación y agentes inteligentes para satisfacer las demandas complejas de aplicaciones de agentes inteligentes. GLM-4.5 es un modelo de razonamiento híbrido que ofrece dos modos: modo de pensamiento para razonamiento complejo y uso de herramientas, y modo sin pensamiento para respuestas inmediatas.
Características clave y arquitectura
- Parámetros: 355 mil millones de parámetros totales con 32 mil millones de parámetros activos.
- Razonamiento híbrido: Dos modos operativos: modo de pensamiento para razonamiento complejo y uso de herramientas, y modo sin pensamiento para respuestas inmediatas.
- Versiones del modelo: Disponible en modelos base, modelos de razonamiento híbrido y versiones FP8.
- Ventana de contexto: 128K tokens.
- Licencia: Licencia de código abierto MIT para uso comercial y desarrollo secundario.
- Capacidades: Funcionalidades unificadas de razonamiento, codificación y agentes inteligentes para aplicaciones complejas.
Comparativa de puntos de referencia de GPT-OSS-120B y GLM-4.5
1. Puntos de referencia de inteligencia

2. Ventana de contexto:
GPT OSS 120B: 128K tokens
GLM-4.5: 128K tokens
3. Precios de la API:
GPT OSS 120B: $0.1 / $0.5 por 1M de tokens de entrada/salida
GLM-4.5: $0.6 / $2.2 por 1M de tokens de entrada/salida
Prueba de habilidades aplicadas de GPT-OSS-120B y GLM-4.5
1. GPT-OSS-120B vs GLM-4.5: ¿Cuál es mejor para la generación de código?
Descripción de la tarea: Implementa una clase Python SmartQueue con la siguiente funcionalidad:
- Admite operaciones de cola de prioridad (números más bajos = mayor prioridad)
- Admite operaciones por lotes (agregar/eliminar múltiples elementos a la vez)
- Implementa un método
auto_process()inteligente que procesa automáticamente los N elementos de mayor prioridad - Incluye seguimiento de estadísticas básicas (recuento total procesado, tamaño actual de la cola)
Requisitos específicos:
# Ejemplo de uso esperado:
queue = SmartQueue()
queue.add_task("task1", priority=2)
queue.add_batch([("task2", 1), ("task3", 3), ("task4", 1)])
print(queue.get_stats()) # Devuelve un diccionario de estadísticas
processed = queue.auto_process(count=2) # Procesa las 2 tareas de mayor prioridad
print(processed) # Devuelve la lista de tareas procesadas
Dimensiones de evaluación:
- Selección de estructura de datos: Si se seleccionan estructuras de datos adecuadas (por ejemplo, heapq)
- Diseño de la API: Razonabilidad de los nombres de los métodos y el diseño de parámetros
- Manejo de errores: Gestión de casos extremos (cola vacía, parámetros no válidos, etc.)
- Organización del código: Estructura de la clase y lógica de implementación de los métodos
- Convenciones de Python: Uso de características y convenciones específicas de Python
- Eficiencia del algoritmo: Consideraciones de complejidad temporal para las operaciones
Desafío adicional: El método auto_process() debe devolver los elementos procesados en un formato significativo y actualizar las estadísticas internas.
GPT-OSS-120B

GLM 4.5

GLM 4.5: Adecuado para aprendizaje y prototipos simples, necesita optimización para uso en producción
GPT OSS 120B: Listo para proyectos profesionales, cumple con los estándares de calidad de código industrial
¡Prueba GPT-OSS-120B y GLM-4.5 tú mismo!
2. ¿Cómo maneja GLM-4.5 las consultas ambiguas en comparación con GPT-OSS-120B?
Prompt: “El banco llamó por el cheque. No tenía fondos suficientes.”
Esta oración contiene varias ambigüedades. Por favor:
- Identifica todas las interpretaciones posibles de esta oración
- Clasifica estas interpretaciones por probabilidad en un contexto moderno
- Explica tu proceso de razonamiento para la desambiguación
- Si necesitaras contexto adicional para estar seguro, ¿qué preguntas específicas harías?
- Proporciona una respuesta como si estuvieras ayudando a alguien a entender lo que probablemente sucedió
Sé explícito sobre tu proceso de pensamiento y cualquier suposición que estés haciendo.
GPT-OSS-120B

GLM 4.5

GPT-OSS-120B demostró una profundidad analítica superior y un razonamiento sistemático, mientras que GLM-4.5 mostró un mejor juicio práctico al equilibrar la exhaustividad con la usabilidad.
GPT-OSS-120B destaca en la desambiguación exhaustiva, mientras que GLM-4.5 prioriza la claridad y la guía accionable.
Cómo acceder a GPT-OSS-120B y GLM-4.5 en Novita AI
Paso 1: Inicia sesión y accede a la biblioteca de modelos
Inicia sesión en tu cuenta y haz clic en el botón Biblioteca de modelos.

¡Prueba GPT-OSS-120B y GLM-4.5 ahora!
Paso 2: Elige tu modelo
Explora las opciones disponibles y selecciona el modelo que se adapte a tus necesidades.

Paso 3: Inicia tu prueba gratuita
Comienza tu prueba gratuita para explorar las capacidades del modelo seleccionado.

Paso 4: Obtén tu clave de API
Para autenticarte con la API, te proporcionaremos una nueva clave de API. Entrando a la página de “Configuración”, puedes copiar la clave de API como se indica en la imagen.

Paso 5: Instala la API
Instala la API utilizando el gestor de paquetes específico de tu lenguaje de programación.

Después de la instalación, importa las bibliotecas necesarias en tu entorno de desarrollo. Inicializa la API con tu clave de API para empezar a interactuar con el LLM de Novita AI. Este es un ejemplo de uso de la API de finalizaciones de chat para usuarios de Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
GPT-OSS-120B destaca como una solución lista para producción, que ofrece una profundidad analítica exhaustiva y un razonamiento sistemático que cumple con los estándares de calidad de código industrial. Su enfoque exhaustivo para la resolución de problemas lo hace adecuado para proyectos profesionales que requieren documentación detallada y análisis riguroso.
GLM-4.5 destaca como una herramienta de desarrollo y creación de prototipos, que ofrece respuestas prácticas y centradas en el usuario con un razonamiento simplificado. Equilibra la exhaustividad con la usabilidad, por lo que es ideal para entornos de aprendizaje y creación rápida de prototipos.
Preguntas frecuentes
¿Qué es GPT-OSS-120B?
GPT-OSS-120B es un modelo MoE de peso abierto de 117B parámetros desarrollado por OpenAI, diseñado para razonamiento de nivel empresarial y despliegue en producción con un rendimiento cercano al de o4-mini.
¿Cómo ajustar un modelo GLM?
Los modelos GLM se pueden desplegar a través de API oficiales en plataformas como Novita AI, con instrucciones de configuración específicas que varían según la versión del modelo y los requisitos de hardware.
¿GPT-4o es de código abierto?
No, pero GPT-OSS-120B es de código abierto y tiene un rendimiento comparable al de GPT-4o, y se puede usar en Novita AI.
Sobre Novita AI
Novita AI es una plataforma de nube de IA que ofrece a los desarrolladores una forma sencilla de desplegar modelos de IA mediante nuestra API simple, además de proporcionar una nube de GPU asequible y fiable para construir y escalar.
