Points clés
GPT-OSS-120B : Un modèle MoE open-weight de 117 milliards de paramètres développé par OpenAI, conçu pour le raisonnement de niveau entreprise et le déploiement en production, avec des performances proches de celles d’o4-mini.
GLM-4.5 : Un modèle fondamental qui unifie les capacités de raisonnement, de codage et d’agent intelligent pour répondre aux exigences complexes des applications d’agents intelligents.
Novita AI propose non seulement des services API stables, mais aussi des tarifs extrêmement avantageux. Par exemple, GPT-OSS-120B coûte 0,1 $ par million de tokens en entrée et 0,5 $ par million de tokens en sortie, tandis que GLM-4.5 coûte 0,6 $ par million de tokens en entrée et 2,2 $ par million de tokens en sortie.
Présentation générale des modèles
GPT-OSS-120B
gpt-oss-120B est un modèle de langage Mixture-of-Experts (MoE) open-weight développé par OpenAI, axé sur un raisonnement puissant, des applications agentiques et un déploiement évolutif. Il est conçu à la fois pour un usage professionnel et développeur à haute performance, atteignant une performance quasi équivalente à celle du modèle o4-mini d’OpenAI sur les benchmarks de raisonnement principaux, tout en restant rentable et accessible.
- Paramètres : 117 milliards de paramètres totaux avec 5,1 milliards de paramètres actifs par étape d’inférence.
- Architecture : Conception Mixture-of-Experts avec 128 experts répartis sur 36 couches, utilisant des activations SwiGLU. Un système de routage d’experts efficace n’active que le sous-ensemble d’experts le plus pertinent pour chaque token, permettant une spécialisation et une efficacité accrues. Il dispose de sinks d’attention appris par tête d’attention pour améliorer les performances.
- Fenêtre de contexte : Prend en charge une fenêtre de contexte de 128 000 tokens, permettant un raisonnement sur de longs textes, des dialogues multi-tours et le traitement de documents ou de bases de code étendues.
- Capacités agentiques : Prise en charge native de l’appel de fonctions, de la navigation web, de l’exécution de code Python et de sorties structurées, ce qui le rend adapté à la construction d’agents intelligents. Compatible avec les formats d’API de réponse d’OpenAI et fine-tunable pour des cas d’usage personnalisés.
GLM-4.5
GLM-4.5 est un modèle fondamental conçu pour les agents intelligents, avec 355 milliards de paramètres totaux et 32 milliards de paramètres actifs. Le modèle unifie les capacités de raisonnement, de codage et d’agent intelligent pour répondre aux exigences complexes des applications d’agents intelligents. GLM-4.5 est un modèle de raisonnement hybride qui propose deux modes : le mode de réflexion pour le raisonnement complexe et l’utilisation d’outils, et le mode sans réflexion pour des réponses immédiates.
Caractéristiques et architecture clés
- Paramètres : 355 milliards de paramètres totaux avec 32 milliards de paramètres actifs.
- Raisonnement hybride : Deux modes de fonctionnement - le mode de réflexion pour le raisonnement complexe et l’utilisation d’outils, et le mode sans réflexion pour des réponses immédiates.
- Versions du modèle : Disponible en modèles de base, modèles de raisonnement hybride et versions FP8.
- Fenêtre de contexte : 128 000 tokens.
- Licence : Licence open-source MIT pour une utilisation commerciale et un développement secondaire.
- Capacités : Fonctionnalités unifiées de raisonnement, de codage et d’agent intelligent pour des applications complexes.
Comparaison des benchmarks de GPT-OSS-120B et GLM-4.5
1. Benchmarks d’intelligence

2. Fenêtre de contexte :
GPT OSS 120B : 128 000 tokens
GLM-4.5 : 128 000 tokens
3. Tarification API :
GPT OSS 120B : 0,1 $ / 0,5 $ par million de tokens en entrée/sortie
GLM-4.5 : 0,6 $ / 2,2 $ par million de tokens en entrée/sortie
Test des compétences appliquées de GPT-OSS-120B et GLM-4.5
1. GPT-OSS-120B vs GLM-4.5 : Lequel est le meilleur pour la génération de code ?
Description de la tâche : Implémentez une classe Python SmartQueue avec les fonctionnalités suivantes :
- Prendre en charge les opérations de file de priorité (les nombres plus bas = priorité plus élevée)
- Prendre en charge les opérations par lot (ajouter/supprimer plusieurs éléments d’un coup)
- Implémenter une méthode
auto_process()intelligente qui traite automatiquement les N éléments de priorité les plus élevés - Inclure un suivi des statistiques de base (nombre total d’éléments traités, taille actuelle de la file)
Exigences spécifiques :
# Exemple d'utilisation attendu :
queue = SmartQueue()
queue.add_task("task1", priority=2)
queue.add_batch([("task2", 1), ("task3", 3), ("task4", 1)])
print(queue.get_stats()) # Renvoie un dictionnaire de statistiques
processed = queue.auto_process(count=2) # Traite les 2 tâches de priorité les plus élevées
print(processed) # Renvoie la liste des tâches traitées
Dimensions d’évaluation :
- Choix de la structure de données : Si des structures de données appropriées (par ex. heapq) sont sélectionnées
- Conception de l’API : Pertinence des noms de méthodes et de la conception des paramètres
- Gestion des erreurs : Traitement des cas limites (file vide, paramètres invalides, etc.)
- Organisation du code : Structure de la classe et logique d’implémentation des méthodes
- Idiomes Python : Utilisation des fonctionnalités et conventions spécifiques à Python
- Efficacité algorithmique : Considérations sur la complexité temporelle des opérations
Défi supplémentaire : La méthode auto_process() doit renvoyer les éléments traités dans un format significatif et mettre à jour les statistiques internes.
GPT-OSS-120B

GLM 4.5

GLM 4.5 : Adapté à l’apprentissage et aux prototypes simples, nécessite une optimisation pour une utilisation en production
GPT OSS 120B : Prêt pour les projets professionnels, répond aux normes de qualité de code industriel
Essayez GPT-OSS-120B et GLM-4.5 vous-même !
2. Comment GLM-4.5 gère-t-il les requêtes ambiguës par rapport à GPT-OSS-120B ?
Prompt : “La banque a appelé à propos du chèque. Il était insuffisant.”
Cette phrase contient plusieurs ambiguïtés. Veuillez :
- Identifier toutes les interprétations possibles de cette phrase
- Classer ces interprétations par ordre de probabilité dans un contexte moderne
- Expliquer votre processus de raisonnement pour la désambiguïsation
- Si vous aviez besoin de contexte supplémentaire pour être certain, quelles questions spécifiques poseriez-vous ?
- Fournir une réponse comme si vous aidiez quelqu’un à comprendre ce qui s’est probablement produit
Soyez explicite sur votre processus de pensée et les hypothèses que vous faites.
GPT-OSS-120B

GLM 4.5

GPT-OSS-120B a fait preuve d’une profondeur analytique et d’un raisonnement systématique supérieurs, tandis que GLM-4.5 a montré un meilleur jugement pratique en équilibrant exhaustivité et utilisabilité.
GPT-OSS-120B excelle dans la désambiguïsation exhaustive, tandis que GLM-4.5 privilégie la clarté et des conseils actionnables.
Comment accéder à GPT-OSS-120B et GLM-4.5 sur Novita AI
Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles
Connectez-vous à votre compte et cliquez sur le bouton Bibliothèque de modèles.

Essayez GPT-OSS-120B et GLM-4.5 maintenant !
Étape 2 : Choisissez votre modèle
Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Étape 3 : Commencez votre essai gratuit
Commencez votre essai gratuit pour explorer les fonctionnalités du modèle sélectionné.

Étape 4 : Récupérez votre clé API
Pour vous authentifier auprès de l’API, nous vous fournirons une nouvelle clé API. En accédant à la page « Paramètres », vous pouvez copier la clé API comme indiqué sur l’image.

Étape 5 : Installez l’API
Installez l’API à l’aide du gestionnaire de paquets spécifique à votre langage de programmation.

Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec les LLM de Novita AI. Voici un exemple d’utilisation de l’API de complétion de chat pour les utilisateurs Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "zai-org/glm-4.5"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
GPT-OSS-120B se distingue comme une solution prête pour la production, offrant une profondeur analytique complète et un raisonnement systématique qui répond aux normes de qualité de code industriel. Son approche exhaustive de la résolution de problèmes le rend adapté aux projets professionnels nécessitant une documentation détaillée et une analyse rigoureuse.
GLM-4.5 excelle en tant qu’outil de développement et de prototypage, offrant des réponses pratiques et centrées sur l’utilisateur avec un raisonnement simplifié. Il équilibre exhaustivité et utilisabilité, ce qui le rend idéal pour les environnements d’apprentissage et le prototypage rapide.
Foire aux questions
Qu’est-ce que GPT-OSS-120B ?
GPT-OSS-120B est un modèle MoE open-weight de 117 milliards de paramètres développé par OpenAI, conçu pour le raisonnement de niveau entreprise et le déploiement en production, avec des performances proches de celles d’o4-mini.
Comment adapter un modèle GLM ?
Les modèles GLM peuvent être déployés via des API officielles sur des plateformes comme Novita AI, les instructions de configuration spécifiques variant selon la version du modèle et les exigences matérielles.
GPT-4o est-il open-source ?
Non, mais GPT-OSS-120B est open-source et offre des performances comparables à GPT-4o, et peut être utilisé sur Novita AI.
À propos de Novita AI
Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles IA via notre API simple, tout en fournissant un cloud GPU abordable et fiable pour la construction et la mise à l’échelle.
