Utiliser MiniMax M2.7 dans Claude Code via Novita AI

Utiliser MiniMax M2.7 dans Claude Code via Novita AI

MiniMax M2.7 est disponible sur Novita AI avec un endpoint compatible Anthropic, ce qui vous permet de l’intégrer directement dans Claude Code avec quatre variables d’environnement, sans aucune autre modification. Le coût d’entrée est de 0,30 $ par million de tokens — soit environ 23 fois moins cher que Claude Opus 4.6 — tandis que le modèle affiche une précision de 97 % sur les appels d’outils avec plus de 40 outils simultanés. Ce guide couvre la configuration exacte, les spécifications vérifiées, le calcul des coûts et les compromis à connaître avant de vous engager.

Réponse rapide : Définissez ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic, ANTHROPIC_AUTH_TOKEN=<votre clé>, et ANTHROPIC_MODEL=minimax/minimax-m2.7 avant de lancer Claude Code. C’est toute l’intégration.

Essayez MiniMax M2.7 sur Novita AI

Pourquoi M2.7 fonctionne comme backend pour Claude Code

Claude Code achemine chaque lecture de fichier, commande terminal et modification via des appels d’outils. Le modèle sous-jacent doit pouvoir invoquer ces outils de manière fiable dans des sessions longues et multi-étapes, pas seulement sur des prompts simples.

Le chiffre clé de M2.7 est une précision de suivi des compétences de 97 % avec plus de 40 outils simultanés, chacun ayant des définitions dépassant 2 000 tokens. Cela correspond directement à la surface d’outils de Claude Code : Read, Write, Edit, Bash, Glob, Grep, WebFetch, et plus encore. Là où les modèles avec une adhérence aux outils plus faible perdent des paramètres ou invoquent la mauvaise fonction en cours de session, M2.7 maintient sa précision.

L’autre chiffre pertinent est la fenêtre de contexte : 204 800 tokens. Cela suffit pour conserver une large base de code, l’historique de la conversation et les résultats des outils dans le contexte, sans avoir à forcer une compaction en cours de tâche.

Ce dans quoi M2.7 excelle dans Claude Code :

  • Refontes multi-fichiers nécessitant un enchaînement d’outils soutenu
  • Workflows de débogage en production (analyse de logs → requêtes bases de données → correction)
  • Tâches de type SWE-Bench : 56,2 % sur SWE-Bench Pro, 52,7 % sur Multi-SWE-Bench
  • Workflows agents nécessitant un raisonnement cohérent multi-tours
  • Équipes soucieuses des coûts exécutant de nombreuses sessions simultanées

Où ajuster les attentes :

  • Modalité d’entrée uniquement textuelle (pas d’image ni de téléchargement de fichier vers le modèle)
  • Contexte de 204 800 tokens, grand mais pas le niveau 1M de M3
  • Un déploiement auto-hébergé nécessite du GPU conséquent — l’accès API est la voie pratique

Spécifications de l’API MiniMax M2.7 sur Novita AI

Champ Valeur
ID du modèle minimax/minimax-m2.7
URL de base Anthropic https://api.novita.ai/anthropic
URL de base OpenAI https://api.novita.ai/openai/v1
Fenêtre de contexte 204 800 tokens
Sortie maximale 131 072 tokens
Modalités d’entrée Texte
Modalités de sortie Texte
Fonctionnalités supportées Appel de fonctions, sortie structurée, raisonnement, mode JSON, compatibilité API Anthropic
Tarif entrée 0,30 $ par million de tokens
Tarif sortie 1,20 $ par million de tokens
Tarif lecture cache 0,06 $ par million de tokens
Date de vérification 03/07/2026, source : page du modèle Novita AI et MiniMax M2.7 sur Novita

L’endpoint compatible Anthropic (/anthropic) est celui qu’utilise Claude Code. L’endpoint compatible OpenAI fonctionne pour les appels API directs et d’autres outils.

Étape 1 : Obtenez votre clé API Novita AI

  1. Allez sur novita.ai et créez un compte (inscription gratuite)
  2. Accédez à Paramètres → Clés API
  3. Cliquez sur Créer une nouvelle clé, nommez-la (par exemple, claude-code-m2.7) et copiez la clé
  4. Gardez la clé hors du code source, des dépôts publics et des notebooks partagés

Stockez-la comme variable d’environnement plutôt que de l’encoder en dur :

export NOVITA_API_KEY="votre_cle_ici"

Étape 2 : Installez Claude Code

Si Claude Code est déjà installé, passez à l’étape 3.

macOS, Linux ou WSL :

curl -fsSL https://claude.ai/install.sh | bash

Windows PowerShell :

irm https://claude.ai/install.ps1 | iex

Windows CMD :

curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd

Les utilisateurs Windows doivent d’abord installer Git for Windows.

Vérifiez l’installation :

claude --version

Étape 3 : Configurez les variables d’environnement

Claude Code lit quatre variables pour acheminer les requêtes vers un endpoint de modèle personnalisé. Définissez les quatre avant de lancer Claude Code.

macOS et Linux :

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<votre clé API Novita>"
export ANTHROPIC_MODEL="minimax/minimax-m2.7"
export ANTHROPIC_SMALL_FAST_MODEL="minimax/minimax-m2.7"

Windows PowerShell :

$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "<votre clé API Novita>"
$env:ANTHROPIC_MODEL = "minimax/minimax-m2.7"
$env:ANTHROPIC_SMALL_FAST_MODEL = "minimax/minimax-m2.7"

ANTHROPIC_SMALL_FAST_MODEL contrôle les opérations légères comme la navigation dans les fichiers et les recherches rapides. Le définir sur le même modèle maintient toutes les requêtes sur le même chemin de facturation et les mêmes tarifs.

Pour rendre la configuration persistante, ajoutez les lignes d’exportation à votre profil shell (~/.bashrc, ~/.zshrc, ou profil PowerShell). Ou gardez un fichier .env au niveau du projet et sourcez-le avant chaque session — mais ne le commitez pas.

Étape 4 : Lancez Claude Code et vérifiez

Naviguez vers votre répertoire de projet et lancez Claude Code :

cd votre-repertoire-projet
claude .

À l’invite, effectuez un test rapide :

> Quels fichiers se trouvent dans ce répertoire ?

Si le modèle répond avec une liste de fichiers en invoquant l’outil approprié, l’intégration fonctionne. Vous pouvez confirmer le modèle utilisé et vérifier les coûts de tokens par requête dans votre tableau de bord d’utilisation Novita AI.

Si vous voyez une erreur d’authentification, vérifiez que ANTHROPIC_AUTH_TOKEN est défini dans la session shell active — pas seulement dans une autre fenêtre de terminal.

Étape 5 : Optimisez pour les workflows agentiques

L’adhérence aux outils de 97 % et la fenêtre de contexte de 204 800 tokens de M2.7 le rendent bien adapté aux sessions agentiques étendues. Voici quelques pratiques pour tirer le meilleur parti de ces capacités :

Donnez d’abord le contexte complet de la base de code au modèle. Avant de demander une modification, laissez Claude Code lire les fichiers pertinents. La grande fenêtre de contexte de M2.7 vous permet de charger plusieurs modules sans atteindre les limites prématurément.

> Lis tous les fichiers dans src/api/ et identifie les fonctions qui gèrent l'authentification

Utilisez une décomposition explicite des tâches pour les travaux complexes. Diviser une grande requête en étapes séquentielles réduit le risque de sortie partielle ou de confusion en cours de session :

> D'abord, analyse le schéma actuel de la base de données. Ensuite, propose la migration nécessaire pour ajouter les suppressions logicielles. N'écris pas encore de code.

Exploitez l’enchaînement d’outils pour le débogage. La force de M2.7 dans le débogage en production est la plus visible dans les séquences multi-étapes : reproduire → tracer → corriger → vérifier.

> Exécute la suite de tests, identifie les tests en échec, trouve la cause racine dans le code source et propose une correction

Gardez les sessions ciblées. M2.7 gère bien la cohérence multi-tours, mais des sessions plus restreintes avec des objectifs clairs produisent des résultats plus fiables que des sessions exploratoires ouvertes qui changent de direction à plusieurs reprises.

Analyse des coûts

À 0,30 $ / 1,20 $ par million de tokens (entrée/sortie), M2.7 est nettement moins cher que la plupart des options de pointe tout en restant compétitif sur les benchmarks agentiques.

Coûts typiques d’un workflow Claude Code avec M2.7 via Novita AI :

Workflow Coût estimé
Petite refonte (5 fichiers, ~200 lignes modifiées) 0,02 $ – 0,05 $
Implémentation de fonctionnalité (20 fichiers, ~1000 lignes) 0,10 $ – 0,20 $
Analyse complète de la base de code (100+ fichiers) 0,25 $ – 0,60 $
Une heure de codage continu à 100 tokens/s ~0,27 $

Comparaison des coûts des modèles pour l’utilisation de Claude Code :

Modèle Entrée par million de tokens Sortie par million de tokens vs. entrée M2.7
MiniMax M2.7 (Novita AI) 0,30 $ 1,20 $
MiniMax M2.5 (Novita AI) 0,30 $ 1,20 $ identique
GLM-5 (Novita AI) 1,00 $ 3,20 $ 3,3x plus
Claude Opus 4.6 ~7,00 $ ~21,00 $ 23x plus

Sources : pages des modèles Novita AI, vérifiées le 03/07/2026. Vérifiez les tarifs actuels avant de budgétiser des charges de travail de production.

La mise en cache des prompts réduit encore les coûts sur les contextes répétés. À 0,06 $ par million de tokens pour les lectures de cache, les charges de travail avec des prompts système stables ou un contexte partagé important en bénéficient considérablement.

Cas d’usage concrets

Refonte multi-fichiers. Le score de 52,7 % de M2.7 sur Multi-SWE-Bench montre qu’il peut gérer des modifications complexes entre fichiers. Claude Code fournit la couche d’approbation interactive — examinez chaque modification proposée avant de la valider.

SRE et réponse aux incidents en production. Le modèle a été formé sur des scénarios de débogage en production : corrélation de métriques, interrogation de bases de données, recherche de causes racines, application de correctifs non bloquants. L’intégration terminal de Claude Code lui permet d’exécuter des diagnostics et de vérifier les correctifs dans la même session.

Développement de frameworks agents. Si vous construisez quelque chose qui orchestre d’autres outils ou modèles, le support natif d’Agent Teams et la cohérence des rôles de M2.7 en font un choix solide pour la couche d’orchestration. Son adhérence aux outils de 97 % compte ici plus que les scores bruts des benchmarks.

Bases de code polyglottes. M2.7 montre de bonnes performances sur plusieurs langages de programmation et gère les projets multilingues sans la baisse de qualité que l’on observe parfois avec des modèles principalement entraînés sur Python/JavaScript.

Équipes sensibles aux coûts qui passent à l’échelle des workflows agentiques. À 0,30 $ par million de tokens d’entrée, les équipes exécutant des sessions Claude Code continues avec plusieurs développeurs peuvent maîtriser les coûts sans descendre à un modèle significativement plus faible.

Dépannage

Erreur d’authentification (401)

Vérifiez que ANTHROPIC_AUTH_TOKEN est défini dans la session shell active. La variable doit être exportée avant d’exécuter claude .. Régénérer la clé et la réexporter est le correctif le plus rapide si vous soupçonnez une corruption de la clé.

Modèle non trouvé

Confirmez que l’ID du modèle est exactement minimax/minimax-m2.7 — sans espaces, ni changements de casse. Les noms d’affichage comme MiniMax M2.7 ne fonctionnent pas comme IDs de modèle.

Requêtes atteignant Anthropic au lieu de Novita

Vérifiez que ANTHROPIC_BASE_URL est défini sur https://api.novita.ai/anthropic. Si la variable est manquante ou vide, Claude Code utilise par défaut le endpoint d’Anthropic et rejettera les requêtes sans une clé Anthropic valide.

Réponses lentes sur la première requête

La première requête d’une session peut prendre quelques secondes supplémentaires en raison du démarrage à froid. Les requêtes suivantes dans la même session sont généralement plus rapides. Si la lenteur persiste entre les requêtes, essayez de réduire max_tokens sur les appels de test pour isoler s’il s’agit du temps de génération ou de la latence réseau.

Erreurs de fenêtre de contexte

M2.7 supporte 204 800 tokens. Si vous chargez de très grandes bases de code, la gestion du contexte de Claude Code effectuera la compaction automatiquement. Pour un contrôle manuel, limitez les fichiers que vous demandez à Claude Code de lire en un seul tour.

Coûts plus élevés que prévu

Vérifiez ANTHROPIC_SMALL_FAST_MODEL. S’il pointe vers un modèle différent et plus cher, les opérations légères comme la navigation dans les répertoires coûteront plus que prévu. Définir les deux variables sur minimax/minimax-m2.7 normalise tout le trafic.

FAQ

MiniMax M2.7 est-il disponible sur Novita AI avec le endpoint compatible Anthropic ?

Oui. Le modèle est disponible sous minimax/minimax-m2.7 avec des endpoints compatibles OpenAI et Anthropic. Claude Code utilise le chemin Anthropic à https://api.novita.ai/anthropic.

Quelle est la différence entre M2.7 et M2.5 pour les workflows Claude Code ?

M2.7 est le modèle le plus performant sur tous les benchmarks : SWE-Bench Pro est passé de 52,2 % à 56,2 %, Multi-SWE-Bench de 51,3 % à 52,7 %, et MLE-Bench lite de 31,5 % à 66,6 %. Les tarifs sont identiques (0,30 $ / 1,20 $ par million de tokens), donc il n’y a aucune raison de coût d’utiliser M2.5 plutôt que M2.7 pour les nouvelles configurations.

M2.7 supporte-t-il la vision ou les entrées d’images dans Claude Code ?

Non. MiniMax M2.7 est purement textuel. Si votre workflow implique des captures d’écran, de l’analyse d’interface utilisateur ou du contexte image, vous auriez besoin d’un modèle multimodal. Pour les workflows de codage textuel, cette limitation ne s’applique pas.

Puis-je utiliser M2.7 dans Claude Code avec les outils MCP ?

Oui. Le support MCP (Model Context Protocol) de Claude Code fonctionne au niveau des outils, pas au niveau du modèle. La haute adhérence aux outils de M2.7 en fait un bon candidat pour les configurations MCP intensives.

L’appel de fonction fonctionne-t-il de manière fiable pour les outils intégrés de Claude Code ?

Oui. M2.7 a été spécifiquement entraîné pour une haute précision d’appel d’outils — 97 % d’adhérence sur plus de 40 outils simultanés dans des conditions de production. Les outils intégrés de Claude Code (Read, Write, Edit, Bash, Glob, Grep) sont bien dans cette plage.

Cette configuration fonctionnera-t-elle avec l’extension VS Code de Claude Code ?

Les variables d’environnement s’appliquent à l’exécution CLI. Si vous utilisez l’extension VS Code, définissez les variables dans votre profil shell ou dans les paramètres du terminal intégré de VS Code afin qu’elles soient disponibles lorsque l’extension démarre une session Claude Code.

Articles recommandés

MiniMax M2.7 sur Novita AI : intelligence de premier plan, tarifs économiques Couverture complète du lancement : architecture d’auto-évolution de M2.7, résultats de benchmarks, capacités agentiques et comparaison des prix avec GLM-5 et Kimi K2.5 sur Novita AI.

Utiliser MiniMax M2.5 dans Claude Code : guide de codage agentique Même modèle d’intégration pour M2.5 — utile si vous comparez M2.5 et M2.7 pour votre workflow, ou si vous migrez une configuration existante M2.5 vers M2.7.

Comment utiliser GLM-5 dans Claude Code : guide de configuration Guide de configuration pour GLM-5 dans Claude Code via Novita AI — le modèle dont les benchmarks se rapprochent le plus de M2.7 sur l’Index d’intelligence, à un prix et une taille de contexte différents.


Novita AI est la plateforme cloud AI & agent qui aide les développeurs et startups à construire, déployer et faire évoluer des modèles et des applications agentiques avec des performances élevées, une fiabilité et une efficacité des coûts.