GLM-4.7 sur Novita AI : Codage agentique à long contexte via API

Table des matières

Qu'est-ce que GLM-4.7 ?
Pourquoi choisir GLM-4.7 sur Novita AI
Fonctionnalités et benchmarks de GLM-4.7
Démarrage avec GLM-4.7 sur Novita AI
Modèles de production
Conclusion

GLM-4.7 est désormais disponible sur la plateforme Novita AI, apportant le dernier modèle texte phare de Z.AI sur une API serverless prête pour la production et compatible OpenAI. GLM-4.7 est optimisé pour le codage agentique, la planification à long terme et les flux de travail utilisant des outils, avec une fiabilité « penser → agir » renforcée et une esthétique front-end nettement améliorée pour la livraison de produits réels.

Sur Novita AI, vous pouvez exécuter GLM-4.7 avec un contexte de 204 800, jusqu’à 131 072 tokens en sortie, une quantification fp8, et une prise en charge native de l’Appel de fonctions et de la Sortie structurée.

Essayez GLM 4.7 maintenant !

Qu’est-ce que GLM-4.7 ?

GLM-4.7 est le dernier modèle texte phare de Z.AI, avec des améliorations majeures axées sur le codage avancé, la planification de tâches à longue portée et une collaboration d’outils plus fiable — conçu pour accomplir des tâches de bout en bout plutôt que de générer uniquement des extraits de code isolés.

Spécifications principales (officielles) :

Fenêtre de contexte : 200 000 tokens
Sortie maximale : 128 000 tokens
Fonctionnalités : modes de réflexion, streaming, appel de fonctions, mise en cache du contexte, sortie structurée (JSON) et intégration d’outils/sources de données MCP

💡Ce que vous obtenez sur Novita AI (serverless prêt pour la production) :

Élément Détails

Modèle GLM-4.7

Longueur de contexte 204 800

Sortie maximale 131 072

Quantification fp8

Appel de fonctions / Sortie structurée Pris en charge

Essayez GLM 4.7 maintenant !


Élément	Détails
Modèle	GLM-4.7
Longueur de contexte	204 800
Sortie maximale	131 072
Quantification	fp8
Appel de fonctions / Sortie structurée	Pris en charge

Pourquoi choisir GLM-4.7 sur Novita AI

Tarification serverless transparente (payez par token)

Sur Novita AI, GLM-4.7 s’exécute en tant que point de terminaison serverless avec une facturation claire par token :

Entrée : 0,6 $ / 1M de tokens
Lecture de cache : 0,11 $ / 1M de tokens
Sortie : 2,2 $ / 1M de tokens

Cette ligne Lecture de cache est importante : elle permet des flux de travail à long terme rentables (pensez à « un agent travaillant sur un grand dépôt/spec sur plusieurs tours »). Cliquez ici pour en savoir plus sur la tarification.

API compatible OpenAI pour une intégration instantanée

Si vous utilisez déjà des API de style Chat Completions d’OpenAI, vous pouvez migrer en définissant l’URL de base de Novita et en changeant le nom du modèle — aucune nouveau protocole à apprendre.

Conçu pour la livraison agentique

Z.AI positionne GLM-4.7 autour de « l’accomplissement des tâches », avec un respect des instructions renforcé lors de l’utilisation d’outils et une stabilité améliorée pour les boucles d’agents complexes.

Fonctionnalités et benchmarks de GLM-4.7

GLM-4.7 est conçu autour du codage agentique (accomplissement des tâches de bout en bout), d’un raisonnement plus fort avec réflexion contrôlable et de flux de travail d’utilisation d’outils plus fiables — avec un saut notable dans la qualité de génération web/UI (« codage vibe »).

Fonctionnalités

Codage agentique, de bout en bout : meilleur pour la planification, la mise en œuvre et l’itération sur des projets multi-fichiers et des frameworks d’agents réels.
Réfléchir avant d’agir (agents plus stables) : respect des instructions amélioré et stabilité des tâches complexes ; prend en charge le contrôle au niveau du tour pour équilibrer coût/latence vs fiabilité.
Utilisation d’outils et navigation web : modèles d’exécution d’outils plus forts et tâches de type navigation.
Amélioration du raisonnement complexe : gains mesurables sur les évaluations de raisonnement difficiles (y compris dans des paramètres augmentés par des outils).
Codage Vibe (qualité UI et diapositives) : pages web modernes plus propres et diapositives/mises en page plus esthétiques.

Benchmarks standardisés

Les scores suivants sont rapportés par Z.AI :


Catégorie	Benchmark	GLM-4.7
Codage (correction de bogues réels)	SWE-bench Verified	73,8
Agentique / terminal	Terminal Bench 2.0	41,0
Codage (en direct)	LiveCodeBench v6	84,9
Utilisation d’outils (interactive)	τ²-Bench	87,4
Navigation web	BrowseComp	52,0 (et 67,5 avec gestion du contexte)
Raisonnement (outils)	HLE (avec outils)	42,8

Signal de « Préférence humaine » de LMArena

Les classements LMArena sont basés sur des votes d’utilisateurs à l’aveugle et constituent un complément utile aux benchmarks pour évaluer « comment ça se ressent ».

Classement WebDev : GLM-4.7 est #6 avec un score de 1447 (+10/-10), 4 833 votes (dernière mise à jour le 16 janvier 2026).
Arène Textuelle (Global) : GLM-4.7 est #18 avec un score de 1443 (±7), 8 258 votes (dernière mise à jour le 12 janvier 2026).

🏆Positionnement en modèle ouvert : sur les deux classements, les modèles classés au-dessus de GLM-4.7 ont des licences Propriétaires, tandis que GLM-4.7 est MIT — ce qui en fait le modèle à licence ouverte le mieux classé dans WebDev et Texte (Global) au moment des mises à jour de ces classements.

Démarrage avec GLM-4.7 sur Novita AI

Option A : Utiliser le Playground

La façon la plus simple de découvrir GLM-4.7 est de l’essayer directement dans le Playground Novita AI. Vous pouvez commencer à interagir avec GLM-4.7 instantanément dans le Playground Novita AI — aucune configuration, aucun code. Inscrivez-vous simplement, ouvrez le Playground et testez des prompts en temps réel. Les nouveaux comptes reçoivent des crédits gratuits après inscription, vous pouvez donc essayer le modèle immédiatement.

Accéder au Playground !

Option B : Intégration via API

Connectez GLM-4.6V à vos applications en utilisant l’API REST unifiée de Novita AI.

Obtenir votre clé API sur Novita AI

Étape 1 : Créer ou se connecter à votre compte

Rendez-vous sur [https://novita.ai](https://novita.ai) et inscrivez-vous ou connectez-vous à votre compte existant.

Étape 2 : Accéder à la gestion des clés

Après connexion, recherchez « Clés API ».

Étape 3 : Créer une nouvelle clé

Cliquez sur le bouton « Ajouter une nouvelle clé ».

Étape 4 : Enregistrez votre clé immédiatement

Copiez et stockez la clé dès qu’elle est générée ; elle n’est généralement affichée qu’une seule fois et ne peut pas être récupérée ultérieurement. Conservez la clé dans un endroit sécurisé comme un gestionnaire de mots de passe ou des notes chiffrées.

Intégration API directe

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="zai-org/glm-4.7",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=131072,
    temperature=0.7
)

print(response.choices[0].message.content)

Flux de travail multi-agents avec OpenAI Agents SDK

Construisez des systèmes d’agents sophistiqués avec une intégration plug-and-play — prenant en charge les transferts, le routage et l’utilisation d’outils via l’appel de fonctions natif, ainsi que la fenêtre de contexte longue complète pour des tâches complexes et multi-étapes.

Option C : Se connecter à des plateformes tierces

Si vous développez déjà avec des frameworks d’agents ou des outils pour développeurs, Novita AI est conçu pour s’intégrer avec un minimum de friction :

Frameworks d’agents et constructeurs d’applications : Suivez les guides d’intégration étape par étape de Novita pour vous connecter à des outils populaires tels que Continue, AnythingLLM, LangChain et Langflow.
Hugging Face Hub : Novita est répertorié comme Fournisseur d’inférence sur Hugging Face, vous pouvez donc exécuter les modèles pris en charge via le flux de travail et l’écosystème de fournisseurs de Hugging Face.
API compatible OpenAI : Les points de terminaison LLM de Novita sont compatibles avec la norme d’API OpenAI, ce qui facilite la migration des applications existantes de style OpenAI et la connexion à de nombreux outils compatibles OpenAI ( Cline, Cursor, Trae et Qwen Code) .
API compatible Anthropic (flux de travail Claude Code) : Novita propose également un accès compatible avec le SDK Anthropic pour que vous puissiez intégrer des modèles supportés par Novita dans des flux de travail de codage agentique de style Claude Code.
OpenCode (fournisseur intégré) : Novita AI est désormais intégré directement à OpenCode en tant que fournisseur pris en charge, les utilisateurs peuvent donc sélectionner Novita dans OpenCode sans configuration manuelle.

Modèles de production

Utilisez la mise en cache de prompts pour les agents à long terme

Si vous exécutez des flux de travail multi-tours sur un contexte large et stable (instantané de dépôt, spec longue, document de conception), la mise en cache peut réduire considérablement les coûts — Novita expose la tarification de Lecture de cache explicitement.

Sortie structurée pour des pipelines fiables

Lors de l’intégration avec des moteurs de flux de travail, des validateurs ou des interfaces utilisateur, préférez les sorties structurées JSON (basées sur un schéma) pour réduire les cas limites d’analyse. Novita indique que la Sortie structurée est prise en charge pour GLM-4.7.

Appel de fonctions pour le codage augmenté par outils

Enveloppez vos outils en tant que fonctions : recherche dans le dépôt, recherche de tickets, déclenchement CI, lecture de base de données, récupération web — puis laissez le modèle décider quand les appeler. GLM-4.7 est explicitement conçu pour une collaboration d’outils plus forte.

Politique du mode de réflexion : « rapide par défaut, approfondi si nécessaire »

questions/réponses triviales / formatage : réflexion désactivée
débogage / refactorisations multi-étapes : réflexion activée
tâches longues : envisagez des modes qui améliorent la stabilité et le taux de succès du cache

Conclusion

GLM-4.7 apporte un ensemble pratique d’améliorations pour les développeurs créant des flux de codage agentique et des flux de travail d’utilisation d’outils à long terme : contexte de 200K, réflexion contrôlable, comportement d’appel de fonctions renforcé et de meilleures sorties de « codage vibe » front-end.

Sur Novita AI, vous pouvez commencer immédiatement avec une API serverless compatible OpenAI, avec une tarification transparente par token et une prise en charge native de l’appel de fonctions et des sorties structurées — prête pour des pipelines d’agents de qualité production.

Plus d’informations sur GLM 4.7

Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles IA via notre API simple, tout en fournissant un cloud GPU abordable et fiable pour la construction et la mise à l’échelle.

Foire aux questions

Qu’est-ce que GLM-4.7 ?

GLM-4.7 est le LLM phare de Z.AI, positionné pour une programmation améliorée et un raisonnement/exécution multi-étapes plus stable, et il est publié avec un modèle open-weights officiel (disponible sur Hugging Face).

GLM-4.7 est-il gratuit ?

Sur Novita AI, GLM-4.7 est payant par token : 0,6 $ par M de tokens (entrée), 0,11 $ par M de tokens (lecture de cache) et 2,2 $ par M de tokens (sortie). Sur Z.ai, l’accès est généralement proposé dans le cadre d’un forfait Coding payant (à partir de 3 $ par mois). Certaines plateformes peuvent proposer des essais/quotas limités comme Novita AI, mais GLM-4.7 lui-même n’est pas universellement « gratuit ».

GLM-4.7 est-il vraiment bon ?

Pour les flux de travail de codage et agentiques, il est positionné comme un modèle ouvert de premier plan par son éditeur. Z.AI rapporte des résultats solides sur les benchmarks de codage et d’agents (par exemple LiveCodeBench v6, SWE-bench Verified, BrowseComp, τ²-Bench), et le présente comme concurrentiel avec Claude Sonnet 4.5 sur plusieurs mesures.

GLM-4.7 sur Novita AI : Codage agentique à long contexte via API

Qu’est-ce que GLM-4.7 ?

Pourquoi choisir GLM-4.7 sur Novita AI

Tarification serverless transparente (payez par token)