Démarrage rapide de l'API Kimi K2.7 Code sur Novita AI

Table des matières

Configuration de l'API Kimi K2.7 Code
Tarification et limites de Kimi K2.7 Code
Exemple cURL de Kimi K2.7 Code
Exemple Python de Kimi K2.7 Code
Entrée image et vidéo
Appel de fonction et sorties structurées
Liste de vérification pour les tests en production
FAQ
Articles recommandés

Kimi K2.7 Code est disponible sur Novita AI avec l’ID du modèle moonshotai/kimi-k2.7-code, un point de terminaison chat/completions compatible OpenAI, une fenêtre de contexte de 262 144 tokens et la prise en charge des entrées texte, image et vidéo. Ce guide de démarrage rapide couvre la configuration pour les développeurs : authentification, première requête, utilisation de l’entrée visuelle, ajout d’appels de fonction et compréhension de la tarification avant de construire. Pour une vue d’ensemble plus large du positionnement et des cas d’utilisation, consultez la Présentation de Kimi K2.7 Code sur Novita AI. Pour intégrer Kimi K2.7 Code dans Claude Code via le point de terminaison compatible Anthropic, voir Comment utiliser Kimi K2.7 Code dans Claude Code.

Configuration de l’API Kimi K2.7 Code

Commencez par trois éléments de configuration :

Élément	Valeur
Clé API	Créez et stockez une clé API Novita AI dans une variable d’environnement comme `NOVITA_API_KEY`.
URL de base compatible OpenAI	`https://api.novita.ai/openai`
Point de terminaison des complétions de chat	`POST https://api.novita.ai/openai/v1/chat/completions`
ID du modèle	`moonshotai/kimi-k2.7-code`

L’index de la documentation Novita AI liste l’URL de base compatible OpenAI, et la référence de l’API des complétions de chat documente l’ensemble des champs des requêtes et des réponses.

Gardez la clé API hors du contrôle de version. Exportez-la dans votre terminal pour le développement local :

export NOVITA_API_KEY="your_api_key"

Si votre application utilise déjà le SDK OpenAI, le changement est minime : pointez l’URL de base vers Novita AI et définissez le modèle sur moonshotai/kimi-k2.7-code.

Tarification et limites de Kimi K2.7 Code

Utilisez l’ID exact du modèle dans le code. Dans l’interface utilisateur, utilisez le nom affiché « Kimi K2.7 Code ».

Champ	Valeur actuelle chez Novita
Nom affiché	Kimi K2.7 Code
ID du modèle API	`moonshotai/kimi-k2.7-code`
Série de modèles	MoonshotAI
Architecture	MoE, 1T paramètres au total, 32B activés
Familles de points de terminaison	`chat/completions`, `anthropic`
Modalités d’entrée	Texte, image, vidéo
Modalité de sortie	Texte
Fenêtre de contexte	262 144 tokens
Tokens de sortie maximum	262 144 tokens
Fonctionnalités	Appel de fonction, sorties structurées, raisonnement

Au 16 juin 2026, Novita liste les prix suivants pour les tokens de moonshotai/kimi-k2.7-code :

Type de token	Prix indiqué
Tokens d’entrée	0,95 $ par million de tokens
Tokens de sortie	4,00 $ par million de tokens
Tokens d’entrée de lecture du cache	0,19 $ par million de tokens

Les tarifs, la disponibilité et les limites de débit peuvent changer. Consultez la page du modèle Kimi K2.7 Code et la page de tarification Novita AI avant le lancement en production ou tout engagement financier.

Exemple cURL de Kimi K2.7 Code

Commencez par une requête textuelle uniquement pour confirmer l’authentification, le routage du modèle et l’analyse de la réponse avant d’ajouter des appels visuels ou d’outils.

curl "https://api.novita.ai/openai/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${NOVITA_API_KEY}" \
  -d '{
    "model": "moonshotai/kimi-k2.7-code",
    "messages": [
      {
        "role": "system",
        "content": "Vous êtes un assistant concis de révision de code."
      },
      {
        "role": "user",
        "content": "Listez trois erreurs courantes lors de l'implémentation de la logique de réessai en Python."
      }
    ],
    "max_tokens": 512,
    "temperature": 0.2
  }'

Une réponse réussie renvoie la structure standard des complétions de chat : un tableau choices, un message avec content, des métadonnées model/created, et un objet usage avec les comptes de tokens prompt, completion et total.

Utilisez ce test de fumée pour vérifier :

La clé API est valide et l’en-tête d’autorisation est correctement formaté.
L’ID du modèle est accepté sans erreur 404 ou modèle non trouvé.
Votre client peut analyser choices[0].message.content.
L’utilisation des tokens est enregistrée afin que vous puissiez suivre les coûts dès la première requête.

Exemple Python de Kimi K2.7 Code

Le SDK Python OpenAI fonctionne avec Novita AI lorsque vous définissez l’URL de base de Novita. Épinglez la version du SDK selon votre propre politique de dépendances.

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "Vous êtes un assistant concis de révision de code."},
        {
            "role": "user",
            "content": "Révisez cette fonction Python pour les erreurs de décalage et les cas limites manquants :\n\ndef get_items(lst, start, end):\n    return lst[start:end]",
        },
    ],
    max_tokens=512,
    temperature=0.2,
)

print(response.choices[0].message.content)
print("Tokens utilisés :", response.usage.total_tokens)

Pour les sessions d’agents de codage longues, définissez max_tokens explicitement. Kimi K2.7 Code prend en charge jusqu’à 262 144 tokens de sortie, mais les agents de production doivent budgétiser l’utilisation des tokens par tour et surveiller le coût cumulé sur les exécutions en plusieurs étapes.

Entrée image et vidéo

Novita liste le texte, l’image et la vidéo comme modalités d’entrée pour Kimi K2.7 Code. Pour l’entrée visuelle, passez un tableau content dans le message utilisateur avec une partie text et une partie image_url :

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "Vous êtes un assistant de révision de code UI."},
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Décrivez les problèmes d'accessibilité visibles dans cette capture d'écran d'interface et suggérez des correctifs CSS.",
                },
                {
                    "type": "image_url",
                    "image_url": {"url": "https://example.com/screenshot.png"},
                },
            ],
        },
    ],
    max_tokens=512,
)

print(response.choices[0].message.content)

Un ordre pratique pour l’intégration multimodale :

Confirmez d’abord que le test textuel seul fonctionne.
Ajoutez une entrée d’image avec une tâche clairement vérifiable, comme extraire des étiquettes d’une capture d’écran d’interface.
Validez à la fois la qualité de la réponse et la structure de la réponse pour votre charge de travail réelle.
Testez les entrées vidéo séparément — commencez par de courts clips, vérifiez le format de la requête et mesurez la latence et les coûts en tokens avant d’ajouter la vidéo à un chemin de production.

Ne supposez pas que chaque charge utile multimodale compatible OpenAI est acceptée de manière identique par chaque modèle hébergé par Novita. Vérifiez la forme exacte de la charge utile image et vidéo dans la documentation actuelle de Novita AI ou les exemples de la console pour moonshotai/kimi-k2.7-code avant de déployer.

Appel de fonction et sorties structurées

Kimi K2.7 Code prend en charge l’appel de fonction via le paramètre tools et les sorties structurées via response_format. Les deux sont répertoriés comme fonctionnalités sur la page du modèle Novita AI.

Utilisez l’appel de fonction lorsque le modèle doit sélectionner un outil et renvoyer des arguments structurés au lieu de répondre en prose :

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

tools = [
    {
        "type": "function",
        "function": {
            "name": "file_search",
            "description": "Rechercher dans le dépôt les fichiers correspondant à un motif.",
            "parameters": {
                "type": "object",
                "properties": {
                    "pattern": {
                        "type": "string",
                        "description": "Motif glob à faire correspondre, ex. '**/*.py'",
                    },
                    "directory": {
                        "type": "string",
                        "description": "Répertoire racine dans lequel effectuer la recherche.",
                    },
                },
                "required": ["pattern"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "Vous êtes un assistant d'analyse de dépôt."},
        {
            "role": "user",
            "content": "Trouvez tous les fichiers Python dans le répertoire src qui pourraient contenir de la logique de migration de base de données.",
        },
    ],
    tools=tools,
    tool_choice="auto",
    temperature=0.1,
)

message = response.choices[0].message
if message.tool_calls:
    for call in message.tool_calls:
        print(f"Outil : {call.function.name}")
        print(f"Arguments : {call.function.arguments}")
else:
    print(message.content)

Pour les sorties structurées, utilisez response_format avec json_schema lorsque vous avez besoin d’une réponse JSON validée sans appel d’outil. Gardez les premiers schémas petits et testez votre analyseur syntaxique par rapport à la forme exacte de la réponse renvoyée par moonshotai/kimi-k2.7-code avant de vous fier au mode strict en production.

L’architecture de pensée entrelacée de Kimi K2.7 Code signifie qu’il raisonne à travers des tâches en plusieurs étapes avant de renvoyer un résultat. Pour les workflows de codage agentiques avec plusieurs appels d’outils par tour, testez comment le choix de l’outil, la qualité des arguments et la latence de réponse se comportent sur votre ensemble de tâches réel avant d’acheminer le trafic de production.

Liste de vérification pour les tests en production

Kimi K2.7 Code est tarifé séparément pour les tokens d’entrée, de sortie et de lecture du cache. Les profils de coûts varient considérablement selon la charge de travail :

Révision de code à contexte long : les grands nombres de tokens d’entrée dominent le coût.
Agents de génération de code : l’utilisation des tokens de sortie augmente avec la longueur de la réponse et le nombre de tours.
Workflows à contexte répété : la tarification de lecture du cache s’applique lorsqu’un prompt système stable, un schéma d’outil ou un résumé de dépôt se répète sur de nombreux appels.

Avant la production, exécutez un ensemble d’évaluation qui inclut :

Des prompts textuels courts (référence de latence et vérification d’authentification).
Des prompts à contexte long proches de votre taille de travail attendue, pas de la fenêtre maximale.
Des prompts d’appel d’outil où le comportement correct est d’appeler une fonction avec des arguments valides.
Des entrées d’image qui correspondent à votre source de téléchargement réelle et à votre gestion de fichiers.
Des cas d’échec : entrée surdimensionnée, URL média manquante, clé API invalide et comportement de délai d’attente.

Les listes de fonctionnalités décrivent ce qui est disponible. L’évaluation sur votre charge de travail réelle vous indique si la latence, l’utilisation des tokens, la qualité des arguments de l’outil et l’exactitude de la sortie répondent à vos exigences de production.

FAQ

Kimi K2.7 Code est-il disponible via Novita AI ?

Oui. Novita AI liste Kimi K2.7 Code comme un LLM serverless avec l’ID du modèle API moonshotai/kimi-k2.7-code.

Quel est le bon ID du modèle ?

Utilisez moonshotai/kimi-k2.7-code dans tous les appels API.

Quel point de terminaison dois-je utiliser ?

Utilisez le point de terminaison de complétions de chat compatible OpenAI : POST https://api.novita.ai/openai/v1/chat/completions. Définissez l’URL de base sur https://api.novita.ai/openai lorsque vous utilisez un client SDK OpenAI.

Combien coûte Kimi K2.7 Code ?

Au 16 juin 2026, Novita AI liste 0,95 $ par million de tokens d’entrée, 4,00 $ par million de tokens de sortie, et 0,19 $ par million de tokens d’entrée de lecture du cache. Vérifiez les prix actuels sur la page du modèle Kimi K2.7 Code avant toute décision d’approvisionnement.

Prend-il en charge les entrées image et vidéo ?

Novita liste le texte, l’image et la vidéo comme modalités d’entrée. Pour la forme exacte de la charge utile, vérifiez avec la documentation actuelle de Novita ou un appel de test avant de déployer des fonctionnalités multimodales.

Kimi K2.7 Code prend-il en charge l’appel de fonction ?

Oui. Utilisez le paramètre tools dans la requête de complétions de chat. Novita liste l’appel de fonction et les sorties structurées comme fonctionnalités prises en charge.

Quelle est la fenêtre de contexte ?

262 144 tokens de fenêtre de contexte et 262 144 tokens de sortie maximale, comme indiqué sur la page du modèle Novita AI.

Démarrage rapide de l'API Kimi K2.7 Code sur Novita AI

Configuration de l’API Kimi K2.7 Code

Tarification et limites de Kimi K2.7 Code

Exemple cURL de Kimi K2.7 Code

Exemple Python de Kimi K2.7 Code

Entrée image et vidéo

Appel de fonction et sorties structurées

Liste de vérification pour les tests en production

FAQ

Kimi K2.7 Code est-il disponible via Novita AI ?

Quel est le bon ID du modèle ?

Quel point de terminaison dois-je utiliser ?

Combien coûte Kimi K2.7 Code ?

Prend-il en charge les entrées image et vidéo ?

Kimi K2.7 Code prend-il en charge l’appel de fonction ?

Quelle est la fenêtre de contexte ?

Articles recommandés

Product

RESOURCES

Partners

Company

Configuration de l’API Kimi K2.7 Code

Tarification et limites de Kimi K2.7 Code

Exemple cURL de Kimi K2.7 Code

Exemple Python de Kimi K2.7 Code

Entrée image et vidéo

Appel de fonction et sorties structurées

Liste de vérification pour les tests en production

FAQ

Kimi K2.7 Code est-il disponible via Novita AI ?

Quel est le bon ID du modèle ?

Quel point de terminaison dois-je utiliser ?

Combien coûte Kimi K2.7 Code ?

Prend-il en charge les entrées image et vidéo ?

Kimi K2.7 Code prend-il en charge l’appel de fonction ?

Quelle est la fenêtre de contexte ?

Articles recommandés

Articles associés

Product

RESOURCES

Partners

Company