Kimi K2.7 Code est disponible sur Novita AI avec l’ID de modèle moonshotai/kimi-k2.7-code, un endpoint chat/completions compatible OpenAI, une fenêtre de contexte de 262 144 tokens, et prend en charge les entrées texte, image et vidéo. Ce guide de démarrage rapide couvre la configuration pour les développeurs : authentifiez-vous, envoyez votre première requête, utilisez une entrée visuelle, ajoutez un appel de fonction, et comprenez la tarification avant de construire. Pour une vue d’ensemble plus large sur le positionnement et les cas d’utilisation, consultez la présentation de Kimi K2.7 Code sur Novita AI.
Configuration de l’API Kimi K2.7 Code
Commencez avec trois éléments de configuration :
| Élément | Valeur |
|---|---|
| Clé API | Créez et stockez une clé API Novita AI dans une variable d’environnement comme NOVITA_API_KEY. |
| URL de base compatible OpenAI | https://api.novita.ai/openai |
| Endpoint de complétions de chat | POST https://api.novita.ai/openai/v1/chat/completions |
| ID du modèle | moonshotai/kimi-k2.7-code |
L’index de la documentation Novita AI liste l’URL de base compatible OpenAI, et la référence de l’API de complétions de chat documente l’ensemble des champs de requête et de réponse.
Gardez la clé API hors du contrôle de version. Exportez-la dans votre shell pour le développement local :
export NOVITA_API_KEY="your_api_key"
Si votre application utilise déjà le SDK OpenAI, le changement est minime : pointez l’URL de base vers Novita AI et définissez le modèle sur moonshotai/kimi-k2.7-code.
Tarification et limites de Kimi K2.7 Code
Utilisez l’ID exact du modèle dans le code. Dans l’interface utilisateur, utilisez le nom d’affichage “Kimi K2.7 Code”.
| Champ | Valeur actuelle chez Novita |
|---|---|
| Nom d’affichage | Kimi K2.7 Code |
| ID du modèle API | moonshotai/kimi-k2.7-code |
| Série de modèles | MoonshotAI |
| Architecture | MoE, 1T paramètres au total, 32B activés |
| Familles d’endpoints | chat/completions, anthropic |
| Modalités d’entrée | Texte, image, vidéo |
| Modalité de sortie | Texte |
| Fenêtre de contexte | 262 144 tokens |
| Max tokens de sortie | 262 144 tokens |
| Fonctionnalités | Appel de fonction, sorties structurées, raisonnement |
Au 16 juin 2026, Novita liste les prix suivants pour les tokens de moonshotai/kimi-k2.7-code :
| Type de token | Prix listé |
|---|---|
| Tokens d’entrée | 0,95 $ par million de tokens |
| Tokens de sortie | 4,00 $ par million de tokens |
| Tokens d’entrée lus en cache | 0,19 $ par million de tokens |
Les prix, la disponibilité et les limites de débit peuvent changer. Consultez la page du modèle Kimi K2.7 Code et la page de tarification Novita AI avant un lancement en production ou tout engagement financier.
Exemple cURL de Kimi K2.7 Code
Commencez par une requête textuelle uniquement pour confirmer l’authentification, le routage du modèle et l’analyse de la réponse avant d’ajouter des appels visuels ou d’outils.
curl "https://api.novita.ai/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer ${NOVITA_API_KEY}" \
-d '{
"model": "moonshotai/kimi-k2.7-code",
"messages": [
{
"role": "system",
"content": "Vous êtes un assistant de révision de code concis."
},
{
"role": "user",
"content": "Listez trois erreurs courantes lors de l'implémentation d'une logique de nouvelle tentative en Python."
}
],
"max_tokens": 512,
"temperature": 0.2
}'
Une réponse réussie renvoie la structure standard des complétions de chat : un tableau choices, un message avec content, des métadonnées modèle/created, et un objet usage avec les compteurs de tokens prompt, completion et total.
Utilisez ce test de fumée pour vérifier :
- La clé API est valide et l’en-tête d’autorisation est correctement formaté.
- L’ID du modèle est accepté sans erreur 404 ou modèle introuvable.
- Votre client peut analyser
choices[0].message.content. - L’utilisation des tokens est enregistrée afin de pouvoir surveiller le coût dès la première requête.
Exemple Python de Kimi K2.7 Code
Le SDK Python OpenAI fonctionne avec Novita AI lorsque vous définissez l’URL de base de Novita. Épinglez la version du SDK selon votre propre politique de dépendances.
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "Vous êtes un assistant de révision de code concis."},
{
"role": "user",
"content": "Révisez cette fonction Python pour les erreurs de décalage et les cas limites manquants :\n\ndef get_items(lst, start, end):\n return lst[start:end]",
},
],
max_tokens=512,
temperature=0.2,
)
print(response.choices[0].message.content)
print("Tokens utilisés :", response.usage.total_tokens)
Pour les longues sessions d’agent de codage, définissez max_tokens explicitement. Kimi K2.7 Code prend en charge jusqu’à 262 144 tokens de sortie, mais les agents en production doivent budgétiser l’utilisation des tokens par tour et surveiller le coût cumulé sur les exécutions en plusieurs étapes.
Entrée image et vidéo
Novita liste le texte, l’image et la vidéo comme modalités d’entrée pour Kimi K2.7 Code. Pour une entrée visuelle, passez un tableau content dans le message utilisateur avec une partie text et une partie image_url :
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "Vous êtes un assistant de révision de code UI."},
{
"role": "user",
"content": [
{
"type": "text",
"text": "Décrivez les problèmes d'accessibilité visibles dans cette capture d'écran de l'interface utilisateur et suggérez des correctifs CSS.",
},
{
"type": "image_url",
"image_url": {"url": "https://example.com/screenshot.png"},
},
],
},
],
max_tokens=512,
)
print(response.choices[0].message.content)
Un ordre pratique pour l’intégration multimodale :
- Confirmez d’abord que le test textuel uniquement fonctionne.
- Ajoutez une entrée image avec une tâche clairement vérifiable, comme extraire des étiquettes d’une capture d’écran d’interface.
- Validez à la fois la qualité de la réponse et la structure de la réponse pour votre charge de travail réelle.
- Testez les entrées vidéo séparément — commencez par de courts clips, vérifiez le format de la requête, et mesurez la latence et les coûts en tokens avant d’ajouter la vidéo à un chemin de production.
Ne supposez pas que chaque charge utile multimodale compatible OpenAI est acceptée de manière identique par chaque modèle hébergé par Novita. Vérifiez la forme exacte de la charge utile image et vidéo dans la documentation actuelle de Novita AI ou dans les exemples de la console pour moonshotai/kimi-k2.7-code avant de mettre en production.
Appel de fonction et sorties structurées
Kimi K2.7 Code prend en charge l’appel de fonction via le paramètre tools et les sorties structurées via response_format. Les deux sont répertoriés comme fonctionnalités sur la page du modèle Novita AI.
Utilisez l’appel de fonction lorsque le modèle doit sélectionner un outil et renvoyer des arguments structurés plutôt que de répondre en prose :
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
tools = [
{
"type": "function",
"function": {
"name": "file_search",
"description": "Rechercher dans le dépôt les fichiers correspondant à un motif.",
"parameters": {
"type": "object",
"properties": {
"pattern": {
"type": "string",
"description": "Motif glob à faire correspondre, par ex. '**/*.py'",
},
"directory": {
"type": "string",
"description": "Répertoire racine dans lequel effectuer la recherche.",
},
},
"required": ["pattern"],
},
},
}
]
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "Vous êtes un assistant d'analyse de dépôt."},
{
"role": "user",
"content": "Trouvez tous les fichiers Python dans le répertoire src qui pourraient contenir une logique de migration de base de données.",
},
],
tools=tools,
tool_choice="auto",
temperature=0.1,
)
message = response.choices[0].message
if message.tool_calls:
for call in message.tool_calls:
print(f"Outil : {call.function.name}")
print(f"Arguments : {call.function.arguments}")
else:
print(message.content)
Pour les sorties structurées, utilisez response_format avec json_schema lorsque vous avez besoin d’une réponse JSON validée sans appel d’outil. Gardez les premiers schémas petits et testez votre analyseur par rapport à la structure exacte de la réponse renvoyée par moonshotai/kimi-k2.7-code avant de vous fier au mode strict en production.
L’architecture de pensée entrelacée (interleaved thinking) de Kimi K2.7 Code signifie qu’il raisonne à travers des tâches en plusieurs étapes avant de renvoyer un résultat. Pour les workflows de codage agentique avec plusieurs appels d’outils par tour, testez comment le choix de l’outil, la qualité des arguments et la latence de réponse se comportent sur votre ensemble de tâches réel avant d’acheminer le trafic de production.
Liste de vérification pour les tests en production
Kimi K2.7 Code est tarifé séparément pour les tokens d’entrée, de sortie et de lecture en cache. Les profils de coût varient considérablement selon la charge de travail :
- Révision de code en contexte long : les grands comptages de tokens d’entrée dominent le coût.
- Agents de génération de code : l’utilisation des tokens de sortie évolue avec la longueur de la réponse et le nombre de tours.
- Workflows à contexte répété : la tarification de lecture en cache s’applique lorsqu’un prompt système stable, un schéma d’outil ou un résumé de dépôt revient sur plusieurs appels.
Avant la production, exécutez un ensemble d’évaluation qui inclut :
- Des prompts textuels courts uniquement (base de latence et vérification de l’authentification).
- Des prompts à contexte long proches de votre taille de travail prévue, pas de la fenêtre maximale.
- Des prompts d’appel d’outil où le comportement correct est d’appeler une fonction avec des arguments valides.
- Des entrées image qui correspondent à votre source de téléchargement réelle et à la gestion des fichiers.
- Des cas d’échec : entrée trop grande, URL de média manquante, clé API invalide et comportement de timeout.
Les listes de fonctionnalités décrivent ce qui est disponible. L’évaluation sur votre charge de travail réelle vous indique si la latence, l’utilisation des tokens, la qualité des arguments de l’outil et l’exactitude de la sortie répondent à votre seuil de production.
FAQ
Kimi K2.7 Code est-il disponible via Novita AI ?
Oui. Novita AI liste Kimi K2.7 Code comme un LLM serverless avec l’ID de modèle API moonshotai/kimi-k2.7-code.
Quel est le bon ID de modèle ?
Utilisez moonshotai/kimi-k2.7-code dans tous les appels API.
Quel endpoint dois-je utiliser ?
Utilisez l’endpoint de complétions de chat compatible OpenAI : POST https://api.novita.ai/openai/v1/chat/completions. Définissez l’URL de base sur https://api.novita.ai/openai lorsque vous utilisez un client SDK OpenAI.
Combien coûte Kimi K2.7 Code ?
Au 16 juin 2026, Novita AI liste 0,95 $ par million de tokens d’entrée, 4,00 $ par million de tokens de sortie et 0,19 $ par million de tokens d’entrée lus en cache. Vérifiez les prix actuels sur la page du modèle Kimi K2.7 Code avant toute décision d’achat.
Prend-il en charge l’entrée image et vidéo ?
Novita liste le texte, l’image et la vidéo comme modalités d’entrée. Pour la forme exacte de la charge utile, vérifiez avec la documentation actuelle de Novita ou un appel de test avant de déployer des fonctionnalités multimodales.
Kimi K2.7 Code prend-il en charge l’appel de fonction ?
Oui. Utilisez le paramètre tools dans la requête de complétions de chat. Novita liste l’appel de fonction et les sorties structurées comme fonctionnalités prises en charge.
Quelle est la fenêtre de contexte ?
262 144 tokens de fenêtre de contexte et 262 144 tokens de sortie maximale, comme indiqué sur la page du modèle Novita AI.
