Kimi K2.7 Code API – Schnellstart auf Novita AI

Inhaltsverzeichnis

Kimi K2.7 Code API – Einrichtung
Kimi K2.7 Code – Preise und Limits
Kimi K2.7 Code cURL-Beispiel
Kimi K2.7 Code Python-Beispiel
Bild- und Videoeingabe
Funktionsaufrufe und strukturierte Ausgaben
Produktionstest-Checkliste
FAQ
Empfohlene Artikel

Kimi K2.7 Code ist auf Novita AI mit der Modell-ID moonshotai/kimi-k2.7-code verfügbar, einem OpenAI-kompatiblen chat/completions-Endpunkt, einem 262.144-Token-Kontextfenster und Unterstützung für Text-, Bild- und Videoeingaben. Dieser Schnellstart behandelt die Entwicklereinrichtung: Authentifizierung, erste Anfrage, Verwendung von Vision-Eingaben, Hinzufügen von Funktionsaufrufen und Verständnis der Preise vor dem Bauen. Für einen breiteren Überblick über Positionierung und Anwendungsfälle siehe Kimi K2.7 Code auf Novita AI – Übersicht. Um Kimi K2.7 Code über den Anthropic-kompatiblen Endpunkt in Claude Code einzubinden, siehe Wie man Kimi K2.7 Code in Claude Code verwendet.

Kimi K2.7 Code API – Einrichtung

Beginnen Sie mit drei Konfigurationselementen:

Element	Wert
API-Schlüssel	Erstellen und speichern Sie einen Novita AI API-Schlüssel in einer Umgebungsvariable wie `NOVITA_API_KEY`.
OpenAI-kompatible Basis-URL	`https://api.novita.ai/openai`
Chat-Completions-Endpunkt	`POST https://api.novita.ai/openai/v1/chat/completions`
Modell-ID	`moonshotai/kimi-k2.7-code`

Das Novita AI Dokumentationsverzeichnis listet die OpenAI-kompatible Basis-URL auf, und die Chat-Completions-API-Referenz dokumentiert die vollständigen Anfrage- und Antwortfelder.

Halten Sie den API-Schlüssel außerhalb der Versionskontrolle. Exportieren Sie ihn in Ihrer Shell für die lokale Entwicklung:

export NOVITA_API_KEY="your_api_key"

Wenn Ihre Anwendung bereits das OpenAI SDK verwendet, ist die Änderung minimal: Richten Sie die Basis-URL auf Novita AI und setzen Sie das Modell auf moonshotai/kimi-k2.7-code.

Kimi K2.7 Code – Preise und Limits

Verwenden Sie die genaue Modell-ID im Code. In der benutzerseitigen UI verwenden Sie den Anzeigenamen „Kimi K2.7 Code".

Feld	Aktueller Novita-Wert
Anzeigename	Kimi K2.7 Code
API-Modell-ID	`moonshotai/kimi-k2.7-code`
Modellserie	MoonshotAI
Architektur	MoE, 1T Parameter insgesamt, 32B aktiviert
Endpunktfamilien	`chat/completions`, `anthropic`
Eingabemodalitäten	Text, Bild, Video
Ausgabemodalität	Text
Kontextfenster	262.144 Token
Maximale Ausgabetoken	262.144 Token
Funktionen	Funktionsaufrufe, strukturierte Ausgaben, Reasoning

Stand 16. Juni 2026 listet Novita folgende Token-Preise für moonshotai/kimi-k2.7-code:

Tokentyp	Gelisteter Preis
Eingabetoken	0,95 $ pro 1 Mio. Token
Ausgabetoken	4,00 $ pro 1 Mio. Token
Cache-Lese-Eingabetoken	0,19 $ pro 1 Mio. Token

Preise, Verfügbarkeit und Ratenbegrenzungen können sich ändern. Prüfen Sie die Kimi K2.7 Code Modellseite und die Novita AI Preisseite vor dem Produktionsstart oder einer Kostenverpflichtung.

Kimi K2.7 Code cURL-Beispiel

Beginnen Sie mit einer reinen Textanfrage, um Authentifizierung, Modell-Routing und Antwortverarbeitung zu bestätigen, bevor Sie Vision oder Tool-Aufrufe hinzufügen.

curl "https://api.novita.ai/openai/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${NOVITA_API_KEY}" \
  -d '{
    "model": "moonshotai/kimi-k2.7-code",
    "messages": [
      {
        "role": "system",
        "content": "Sie sind ein prägnanter Code-Review-Assistent."
      },
      {
        "role": "user",
        "content": "Nennen Sie drei häufige Fehler bei der Implementierung von Wiederholungslogik in Python."
      }
    ],
    "max_tokens": 512,
    "temperature": 0.2
  }'

Eine erfolgreiche Antwort gibt die standardmäßige Chat-Completions-Form zurück: ein choices-Array, eine Nachricht mit content, Modell-/Erstellungs-Metadaten und ein usage-Objekt mit Prompt-, Completion- und Gesamttokenanzahlen.

Verwenden Sie diesen Smoke-Test, um Folgendes zu überprüfen:

Der API-Schlüssel ist gültig und der Autorisierungsheader korrekt formatiert.
Die Modell-ID wird ohne 404- oder Modell-nicht-gefunden-Fehler akzeptiert.
Ihr Client kann choices[0].message.content parsen.
Die Token-Nutzung wird protokolliert, sodass Sie die Kosten ab der ersten Anfrage überwachen können.

Kimi K2.7 Code Python-Beispiel

Das OpenAI Python SDK funktioniert mit Novita AI, wenn Sie die Novita-Basis-URL setzen. Pinnen Sie die SDK-Version gemäß Ihrer eigenen Abhängigkeitsrichtlinie.

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "Sie sind ein prägnanter Code-Review-Assistent."},
        {
            "role": "user",
            "content": "Überprüfen Sie diese Python-Funktion auf Off-by-One-Fehler und fehlende Randfälle:\n\ndef get_items(lst, start, end):\n    return lst[start:end]",
        },
    ],
    max_tokens=512,
    temperature=0.2,
)

print(response.choices[0].message.content)
print("Tokens used:", response.usage.total_tokens)

Setzen Sie für lange Coding-Agent-Sitzungen max_tokens explizit. Kimi K2.7 Code unterstützt bis zu 262.144 Ausgabetoken, aber Produktionsagenten sollten die Token-Nutzung pro Durchgang budgetieren und die kumulierten Kosten über mehrere Schritte hinweg überwachen.

Bild- und Videoeingabe

Novita listet Text, Bild und Video als Eingabemodalitäten für Kimi K2.7 Code. Für Vision-Eingaben übergeben Sie ein content-Array in der Benutzernachricht mit einem text- und einem image_url-Teil:

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "Sie sind ein UI-Code-Review-Assistent."},
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Beschreiben Sie alle auf diesem UI-Screenshot sichtbaren Barrierefreiheitsprobleme und schlagen Sie CSS-Korrekturen vor.",
                },
                {
                    "type": "image_url",
                    "image_url": {"url": "https://example.com/screenshot.png"},
                },
            ],
        },
    ],
    max_tokens=512,
)

print(response.choices[0].message.content)

Eine sinnvolle Reihenfolge für die multimodale Integration:

Bestätigen Sie zuerst, dass der reine Text-Smoke-Test funktioniert.
Fügen Sie eine Bildeingabe mit einer klar überprüfbaren Aufgabe hinzu, z. B. das Extrahieren von Labels aus einem UI-Screenshot.
Validieren Sie sowohl die Antwortqualität als auch die Antwortform für Ihre reale Arbeitslast.
Testen Sie Videoeingaben separat – beginnen Sie mit kurzen Clips, überprüfen Sie das Anfrageformat und messen Sie Latenz und Token-Kosten, bevor Sie Video in einen Produktionspfad aufnehmen.

Gehen Sie nicht davon aus, dass jede OpenAI-kompatible multimodale Nutzlast von jedem Novita-gehosteten Modell identisch akzeptiert wird. Überprüfen Sie die genaue Bild- und Video-Payload-Form in der aktuellen Novita AI Dokumentation oder in Konsolenbeispielen für moonshotai/kimi-k2.7-code, bevor Sie ausliefern.

Funktionsaufrufe und strukturierte Ausgaben

Kimi K2.7 Code unterstützt Funktionsaufrufe über den tools-Parameter und strukturierte Ausgaben über response_format. Beide sind als Funktionen auf der Novita AI Modellseite aufgeführt.

Verwenden Sie Funktionsaufrufe, wenn das Modell ein Tool auswählen und strukturierte Argumente zurückgeben soll, anstatt in Prosa zu antworten:

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

tools = [
    {
        "type": "function",
        "function": {
            "name": "file_search",
            "description": "Durchsuchen Sie das Repository nach Dateien, die einem Muster entsprechen.",
            "parameters": {
                "type": "object",
                "properties": {
                    "pattern": {
                        "type": "string",
                        "description": "Glob-Muster zum Abgleichen, z. B. '**/*.py'",
                    },
                    "directory": {
                        "type": "string",
                        "description": "Stammverzeichnis für die Suche.",
                    },
                },
                "required": ["pattern"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "Sie sind ein Repository-Analyse-Assistent."},
        {
            "role": "user",
            "content": "Finden Sie alle Python-Dateien im src-Verzeichnis, die Datenbank-Migrationslogik enthalten könnten.",
        },
    ],
    tools=tools,
    tool_choice="auto",
    temperature=0.1,
)

message = response.choices[0].message
if message.tool_calls:
    for call in message.tool_calls:
        print(f"Tool: {call.function.name}")
        print(f"Arguments: {call.function.arguments}")
else:
    print(message.content)

Für strukturierte Ausgaben verwenden Sie response_format mit json_schema, wenn Sie eine validierte JSON-Antwort ohne Tool-Aufruf benötigen. Halten Sie frühe Schemas klein und testen Sie Ihren Parser gegen die genaue Antwortform, die moonshotai/kimi-k2.7-code zurückgibt, bevor Sie sich im Produktivbetrieb auf den strikten Modus verlassen.

Die verschränkte Denkarchitektur von Kimi K2.7 Code bedeutet, dass es mehrschrittige Aufgaben durchdenkt, bevor es ein Ergebnis zurückgibt. Testen Sie für agentische Coding-Workflows mit mehreren Tool-Aufrufen pro Durchgang, wie sich Tool-Wahl, Argumentqualität und Antwortlatenz bei Ihrem tatsächlichen Aufgabensatz verhalten, bevor Sie Produktionsverkehr leiten.

Produktionstest-Checkliste

Kimi K2.7 Code wird getrennt für Eingabe-, Ausgabe- und Cache-Lese-Token bepreist. Kostenprofile variieren erheblich je nach Arbeitslast:

Langkontext-Code-Review: Große Eingabe-Token-Anzahlen dominieren die Kosten.
Code-Generierungsagenten: Die Ausgabe-Token-Nutzung skaliert mit der Antwortlänge und der Anzahl der Durchgänge.
Wiederholte Kontext-Workflows: Cache-Lese-Preise gelten, wenn ein stabiler System-Prompt, ein Tool-Schema oder eine Repository-Zusammenfassung über viele Aufrufe hinweg wiederkehrt.

Führen Sie vor der Produktion ein Evaluationsset durch, das Folgendes umfasst:

Kurze Text-only-Prompts (Latenz-Baseline und Authentifizierungsprüfung).
Langkontext-Prompts nahe Ihrer erwarteten Arbeitsgröße, nicht dem maximalen Fenster.
Tool-Aufruf-Prompts, bei denen das korrekte Verhalten der Aufruf einer Funktion mit gültigen Argumenten ist.
Bildeingaben, die Ihrer tatsächlichen Upload-Quelle und Dateiverarbeitung entsprechen.
Fehlerfälle: Überdimensionierte Eingabe, fehlende Medien-URL, ungültiger API-Schlüssel und Timeout-Verhalten.

Funktionslisten beschreiben, was verfügbar ist. Die Evaluierung an Ihrer realen Arbeitslast sagt Ihnen, ob Latenz, Token-Nutzung, Tool-Argumentqualität und Ausgabekorrektheit Ihre Produktionsanforderungen erfüllen.

FAQ

Ist Kimi K2.7 Code über Novita AI verfügbar?

Ja. Novita AI listet Kimi K2.7 Code als Serverless LLM mit der API-Modell-ID moonshotai/kimi-k2.7-code.

Was ist die richtige Modell-ID?

Verwenden Sie moonshotai/kimi-k2.7-code in allen API-Aufrufen.

Welchen Endpunkt soll ich verwenden?

Verwenden Sie den OpenAI-kompatiblen Chat-Completions-Endpunkt: POST https://api.novita.ai/openai/v1/chat/completions. Setzen Sie die Basis-URL auf https://api.novita.ai/openai, wenn Sie einen OpenAI SDK-Client verwenden.

Was kostet Kimi K2.7 Code?

Stand 16. Juni 2026 listet Novita AI 0,95 $ pro 1 Mio. Eingabe-Token, 4,00 $ pro 1 Mio. Ausgabe-Token und 0,19 $ pro 1 Mio. Cache-Lese-Eingabe-Token. Überprüfen Sie die aktuellen Preise auf der Kimi K2.7 Code Modellseite vor einer Beschaffungsentscheidung.

Unterstützt es Bild- und Videoeingabe?

Novita listet Text, Bild und Video als Eingabemodalitäten. Überprüfen Sie die genaue Payload-Form mit der aktuellen Novita-Dokumentation oder einem Testaufruf, bevor Sie multimodale Funktionen ausliefern.

Unterstützt Kimi K2.7 Code Funktionsaufrufe?

Ja. Verwenden Sie den tools-Parameter in der Chat-Completions-Anfrage. Novita listet Funktionsaufrufe und strukturierte Ausgaben als unterstützte Funktionen.

Wie groß ist das Kontextfenster?

262.144 Token Kontextfenster und maximal 262.144 Token Ausgabe, wie auf der Novita AI Modellseite angegeben.

Kimi K2.7 Code API – Schnellstart auf Novita AI

Kimi K2.7 Code API – Einrichtung

Kimi K2.7 Code – Preise und Limits

Kimi K2.7 Code cURL-Beispiel

Kimi K2.7 Code Python-Beispiel

Bild- und Videoeingabe

Funktionsaufrufe und strukturierte Ausgaben

Produktionstest-Checkliste

FAQ

Ist Kimi K2.7 Code über Novita AI verfügbar?

Was ist die richtige Modell-ID?

Welchen Endpunkt soll ich verwenden?

Was kostet Kimi K2.7 Code?

Unterstützt es Bild- und Videoeingabe?

Unterstützt Kimi K2.7 Code Funktionsaufrufe?

Wie groß ist das Kontextfenster?

Empfohlene Artikel

Product

RESOURCES

Partners

Company

Kimi K2.7 Code API – Einrichtung

Kimi K2.7 Code – Preise und Limits

Kimi K2.7 Code cURL-Beispiel

Kimi K2.7 Code Python-Beispiel

Bild- und Videoeingabe

Funktionsaufrufe und strukturierte Ausgaben

Produktionstest-Checkliste

FAQ

Ist Kimi K2.7 Code über Novita AI verfügbar?

Was ist die richtige Modell-ID?

Welchen Endpunkt soll ich verwenden?

Was kostet Kimi K2.7 Code?

Unterstützt es Bild- und Videoeingabe?

Unterstützt Kimi K2.7 Code Funktionsaufrufe?

Wie groß ist das Kontextfenster?

Empfohlene Artikel

Ähnliche Beiträge

Product

RESOURCES

Partners

Company