- Pourquoi utiliser Kimi K2.7 Code dans Claude Code ?
- Spécifications de Kimi K2.7 Code en un coup d'œil
- Combien coûte Kimi K2.7 Code sur Novita AI ?
- Étape 1 : Obtenez votre clé API Novita AI
- Étape 2 : Installer Claude Code
- Étape 3 : Configurer les variables d'environnement
- Étape 4 : Lancer Claude Code
- Conseils pratiques pour le flux de travail de codage
- Dépannage
- FAQ
- Articles recommandés
Kimi K2.7 Code est un modèle MoE (Mixture of Experts) spécialisé dans le codage, développé par MoonshotAI, avec une fenêtre de contexte de 256K tokens, une réflexion entrelacée (interleaved thinking) et un appel d’outils multi-étapes. Grâce au point de terminaison compatible Anthropic de Novita AI, vous pouvez l’intégrer directement dans Claude Code — tout en conservant votre flux de travail existant, mais en utilisant un modèle spécialement conçu pour le codage agentique à une fraction du prix de Claude Sonnet.
Ce guide vous accompagne à chaque étape : obtenir votre clé API, configurer les variables d’environnement et lancer Claude Code avec moonshotai/kimi-k2.7-code comme modèle.
Pourquoi utiliser Kimi K2.7 Code dans Claude Code ?
Claude Code utilise le SDK Anthropic en interne, il a donc besoin d’un point de terminaison compatible Anthropic — et non d’un point de terminaison compatible OpenAI. Novita AI expose exactement cela à l’adresse https://api.novita.ai/anthropic, faisant de Kimi K2.7 Code un modèle directement compatible avec Claude Code, sans aucune bibliothèque d’encapsulation ni outillage supplémentaire.
Le cas pratique se résume à trois éléments :
Coût. À 0,95 $ par million de tokens d’entrée et 4,00 $ par million de tokens de sortie sur Novita AI (vérifié en juin 2026), Kimi K2.7 Code est environ 68% moins cher à l’entrée et 73% moins cher à la sortie que Claude Sonnet 4.5 (3,00$/15,00$ par million de tokens). Pour les équipes qui exécutent des centaines de tâches de codage par jour, cette différence est significative.
Contexte. La fenêtre de contexte de 256K tokens signifie que vous pouvez envoyer un contexte substantiel du dépôt — plusieurs fichiers, résultats de tests, notes d’architecture — sans rencontrer de limite en milieu de session. La plupart des agents de codage quotidiens fonctionnent bien dans une fourchette de 32K à 64K tokens ; disposer de 256K signifie que vous avez rarement besoin d’élaguer le contexte.
Spécialisation dans le codage. Kimi K2.7 Code est spécialement conçu pour le codage et les flux de travail agentiques, et non un modèle à usage général. Son architecture de réflexion entrelacée génère environ 30% de tokens de réflexion en moins que Kimi K2.6, ce qui se traduit par des réponses plus rapides sur les tâches de codage multi-étapes.
Spécifications de Kimi K2.7 Code en un coup d’œil
| Champ | Valeur |
|---|---|
| ID du modèle | moonshotai/kimi-k2.7-code |
| Architecture | Mixture of Experts (MoE) |
| Paramètres totaux | 1T |
| Paramètres activés | 32B par token |
| Fenêtre de contexte | 262 144 tokens (~256K) |
| Tokens de sortie max | 262 144 tokens |
| Modalités d’entrée | Texte, image, vidéo |
| Modalité de sortie | Texte |
| Fonctionnalités | Appel de fonctions, sorties structurées, raisonnement (réflexion entrelacée) |
| Points de terminaison sur Novita AI | chat/completions, anthropic |
Pour Claude Code, utilisez la famille de points de terminaison anthropic — c’est ce qu’attend le SDK Anthropic.
Combien coûte Kimi K2.7 Code sur Novita AI ?
| Type de token | Prix Novita AI | Prix Claude Sonnet 4.5 |
|---|---|---|
| Entrée | 0,95 $ / 1M | 3,00 $ / 1M |
| Entrée en lecture de cache | 0,19 $ / 1M | — |
| Sortie | 4,00 $ / 1M | 15,00 $ / 1M |
Tarifs basés sur la page du modèle Kimi K2.7 Code sur Novita AI en date de juin 2026. Novita AI propose également un tarif de lecture de cache, ce qui est important pour les flux de travail à contexte répété, comme les agents qui réutilisent le même prompt système et le même schéma d’outils sur de nombreux appels.
Étape 1 : Obtenez votre clé API Novita AI
Créez un compte Novita AI — les nouveaux comptes reçoivent des crédits d’essai gratuits.
Une fois connecté :
- Allez dans Gestion des clés de votre tableau de bord.
- Cliquez sur Créer une nouvelle clé.
- Copiez la clé immédiatement et conservez-la dans un endroit sûr — elle n’est affichée qu’une seule fois.
Vous utiliserez cette clé comme ANTHROPIC_AUTH_TOKEN à l’étape suivante.
Étape 2 : Installer Claude Code
Claude Code nécessite Node.js 18 ou une version ultérieure. Vérifiez d’abord votre version :
node --version
Installez Claude Code globalement :
npm install -g @anthropic-ai/claude-code
Vérifiez l’installation :
claude --version
Étape 3 : Configurer les variables d’environnement
Claude Code lit quatre variables d’environnement pour savoir quel point de terminaison, clé API et modèle utiliser. Définissez les quatre — ANTHROPIC_SMALL_FAST_MODEL contrôle le modèle que Claude Code utilise pour les sous-tâches légères comme les résumés et les modifications rapides.
Mac et Linux
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="YOUR_NOVITA_API_KEY"
export ANTHROPIC_MODEL="moonshotai/kimi-k2.7-code"
export ANTHROPIC_SMALL_FAST_MODEL="moonshotai/kimi-k2.7-code"
Pour rendre ces variables permanentes, ajoutez les quatre lignes à ~/.zshrc ou ~/.bashrc, puis exécutez source ~/.zshrc (ou ~/.bashrc).
Windows (Invite de commandes)
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=YOUR_NOVITA_API_KEY
set ANTHROPIC_MODEL=moonshotai/kimi-k2.7-code
set ANTHROPIC_SMALL_FAST_MODEL=moonshotai/kimi-k2.7-code
Ces variables d’environnement sont valables pour la session en cours. Pour une configuration permanente sous Windows, ajoutez-les via Propriétés système → Variables d’environnement.
Rôle de chaque variable
| Variable | Valeur | Rôle |
|---|---|---|
ANTHROPIC_BASE_URL |
https://api.novita.ai/anthropic |
Dirige Claude Code vers le point de terminaison compatible Anthropic de Novita AI |
ANTHROPIC_AUTH_TOKEN |
Votre clé API Novita | Authentifie vos requêtes |
ANTHROPIC_MODEL |
moonshotai/kimi-k2.7-code |
Définit le modèle principal pour les tâches de codage |
ANTHROPIC_SMALL_FAST_MODEL |
moonshotai/kimi-k2.7-code |
Définit le modèle pour les sous-tâches légères |
Étape 4 : Lancer Claude Code
Naviguez vers votre répertoire de projet et démarrez une session :
cd your-project-directory
claude .
Claude Code ouvre une invite interactive. Vous pouvez maintenant décrire des tâches en langage naturel — implémenter une fonctionnalité, corriger un bug, refactoriser un module, écrire des tests — et Kimi K2.7 Code gère le raisonnement et la génération de code via le point de terminaison de Novita AI.
Pour vérifier que le modèle est correctement routé, exécutez /status dans la session Claude Code. Cela devrait afficher l’URL de base et le modèle configurés.
Conseils pratiques pour le flux de travail de codage
Envoyez plus de contexte en amont. Avec 256K tokens disponibles, vous pouvez inclure le contenu complet des fichiers concernés plutôt que de simples extraits. Claude Code peut ainsi référencer le code réel plutôt que de raisonner à partir de résumés, ce qui réduit les hallucinations sur les détails d’implémentation.
Utilisez la réflexion entrelacée pour les tâches complexes. Kimi K2.7 Code raisonne étape par étape avant de générer du code. Pour les refontes multi-fichiers ou les décisions architecturales, donnez au modèle suffisamment de contexte pour voir l’ensemble du tableau — il planifiera avant d’écrire, ce qui réduit les corrections ultérieures.
Débogage multimodal. Kimi K2.7 Code accepte les images et les vidéos comme entrée. Si votre flux de travail inclut des rapports de bugs basés sur des captures d’écran ou des tâches de revue d’interface utilisateur, vous pouvez les intégrer directement dans la session. Les réponses sont toujours textuelles, donc la sortie est du code, des plans ou des analyses.
Prompts système avec cache intensif. Si vous utilisez un prompt système cohérent sur plusieurs sessions — normes de codage, conventions de projet, notes d’architecture — le tarif de lecture du cache de Novita AI à 0,19 $ par million de tokens s’applique sur le contenu répété. Pour les équipes avec des prompts système longs et stables, cela réduit considérablement le coût par tâche.
Restez sur un seul modèle pour la cohérence. Définir à la fois ANTHROPIC_MODEL et ANTHROPIC_SMALL_FAST_MODEL sur moonshotai/kimi-k2.7-code maintient un comportement cohérent entre la tâche principale et les sous-tâches. Si vous souhaitez plus tard un modèle plus léger pour les sous-tâches afin d’économiser des coûts, vous pouvez échanger uniquement ANTHROPIC_SMALL_FAST_MODEL.
Dépannage
401 Non autorisé
Votre clé API est incorrecte ou a expiré. Vérifiez la clé dans Gestion des clés Novita AI. Vérifiez la présence d’espaces supplémentaires ou de sauts de ligne lors de la copie de la clé.
Modèle introuvable / 404
Confirmez que l’ID du modèle est exactement moonshotai/kimi-k2.7-code — sans espaces supplémentaires, avec la bonne casse. Vous pouvez vérifier sur la page du modèle Kimi K2.7 Code.
Réponses lentes sur les prompts longs
Activez le streaming par défaut dans Claude Code — la plupart des configurations le font automatiquement. Pour des entrées de contexte très longues (100K+ tokens), la latence de réponse initiale augmente. Envisagez de réduire d’abord le contexte de faible priorité.
Variables d’environnement non prises en compte
Sous Mac/Linux, confirmez que vous avez sourcé le fichier de profil après l’avoir modifié (source ~/.zshrc). Sous Windows, les variables d’environnement définies via set ne sont valables que pour la session d’invite de commandes en cours — utilisez le panneau Propriétés système pour des variables persistantes.
FAQ
Kimi K2.7 Code fonctionne-t-il avec l’utilisation d’outils et les intégrations MCP de Claude Code ?
Oui. Kimi K2.7 Code prend en charge l’appel de fonctions via le point de terminaison compatible Anthropic de Novita AI, ce que Claude Code utilise pour les appels d’outils et les intégrations MCP.
Pourquoi utiliser le point de terminaison Anthropic plutôt que compatible OpenAI ?
Claude Code est construit sur le SDK Anthropic. Il communique en utilisant le format de message d’Anthropic, pas celui d’OpenAI. Le point de terminaison https://api.novita.ai/anthropic de Novita AI traduit ce format, donc Claude Code fonctionne sans aucune modification.
Comment Kimi K2.7 Code se compare-t-il à Kimi K2.5 pour Claude Code ?
Kimi K2.7 Code génère environ 30% de tokens de réflexion en moins que K2.6 (et améliore l’efficacité par rapport à K2.5), tout en maintenant la qualité du codage. Pour les sessions Claude Code avec des tâches multi-étapes répétées, moins de tokens de réflexion signifie des réponses plus rapides et un coût de token par tâche réduit.
Puis-je utiliser cette configuration dans VS Code ou Cursor ?
Oui. Claude Code s’intègre avec VS Code et Cursor via des plugins et le terminal. La même configuration de variables d’environnement s’applique — une fois définies, les intégrations IDE et le terminal autonome utilisent le modèle configuré.
Novita AI est une plateforme cloud d’IA qui offre aux développeurs un moyen simple d’accéder à des modèles de pointe via une API simple, avec une infrastructure GPU abordable et fiable.
