Kimi K2.7 Code ist auf Novita AI mit der Modell-ID moonshotai/kimi-k2.7-code, einem OpenAI-kompatiblen chat/completions-Endpunkt, einem 262.144-Token-Kontextfenster und Unterstützung für Text-, Bild- und Videoeingaben verfügbar. Dieser Schnellstart behandelt die Entwicklereinrichtung: Authentifizierung, erste Anfrage, Verwendung von Bildeingaben, Hinzufügen von Function Calling und Verständnis der Preise vor dem Erstellen. Für einen breiteren Überblick über Positionierung und Anwendungsfälle siehe Kimi K2.7 Code auf Novita AI – Übersicht.
Kimi K2.7 Code API Einrichtung
Beginnen Sie mit drei Konfigurationselementen:
| Element | Wert |
|---|---|
| API-Schlüssel | Erstellen und speichern Sie einen Novita AI API-Schlüssel in einer Umgebungsvariable wie NOVITA_API_KEY. |
| OpenAI-kompatible Basis-URL | https://api.novita.ai/openai |
| Chat-Completions-Endpunkt | POST https://api.novita.ai/openai/v1/chat/completions |
| Modell-ID | moonshotai/kimi-k2.7-code |
Der Novita AI Dokumentationsindex listet die OpenAI-kompatible Basis-URL auf, und die Chat-Completions-API-Referenz dokumentiert die vollständigen Anfrage- und Antwortfelder.
Halten Sie den API-Schlüssel außerhalb der Versionsverwaltung. Exportieren Sie ihn in Ihrer Shell für die lokale Entwicklung:
export NOVITA_API_KEY="your_api_key"
Wenn Ihre Anwendung bereits das OpenAI SDK verwendet, ist die Änderung minimal: Richten Sie die Basis-URL auf Novita AI und setzen Sie das Modell auf moonshotai/kimi-k2.7-code.
Preise und Limits von Kimi K2.7 Code
Verwenden Sie die genaue Modell-ID im Code. In der benutzerseitigen Oberfläche verwenden Sie den Anzeigenamen “Kimi K2.7 Code”.
| Feld | Aktueller Novita-Wert |
|---|---|
| Anzeigename | Kimi K2.7 Code |
| API-Modell-ID | moonshotai/kimi-k2.7-code |
| Modellserie | MoonshotAI |
| Architektur | MoE, 1T Parameter gesamt, 32B aktiviert |
| Endpunktfamilien | chat/completions, anthropic |
| Eingabemodalitäten | Text, Bild, Video |
| Ausgabemodalität | Text |
| Kontextfenster | 262.144 Token |
| Maximale Ausgabetoken | 262.144 Token |
| Funktionen | Function Calling, Structured Outputs, Reasoning |
Stand 16. Juni 2026 listet Novita diese Token-Preise für moonshotai/kimi-k2.7-code:
| Tokentyp | Gelisteter Preis |
|---|---|
| Eingabetoken | 0,95 $ pro 1 Mio. Token |
| Ausgabetoken | 4,00 $ pro 1 Mio. Token |
| Cache-Lese-Eingabetoken | 0,19 $ pro 1 Mio. Token |
Preise, Verfügbarkeit und Ratenlimits können sich ändern. Überprüfen Sie die Kimi K2.7 Code Modellseite und die Novita AI Preisseite vor dem Produktionsstart oder einer Kostenverpflichtung.
cURL-Beispiel für Kimi K2.7 Code
Beginnen Sie mit einer reinen Textanfrage, um Authentifizierung, Modell-Routing und Antwort-Parsing zu bestätigen, bevor Sie Bild- oder Tool-Aufrufe hinzufügen.
curl "https://api.novita.ai/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer ${NOVITA_API_KEY}" \
-d '{
"model": "moonshotai/kimi-k2.7-code",
"messages": [
{
"role": "system",
"content": "Sie sind ein präziser Code-Review-Assistent."
},
{
"role": "user",
"content": "Nennen Sie drei häufige Fehler bei der Implementierung von Wiederholungslogik in Python."
}
],
"max_tokens": 512,
"temperature": 0.2
}'
Eine erfolgreiche Antwort gibt die Standard-Chat-Completions-Struktur zurück: ein choices-Array, eine Nachricht mit content, Modell/Erstellungs-Metadaten und ein usage-Objekt mit Prompt-, Completion- und Gesamttokenanzahlen.
Verwenden Sie diesen Smoke-Test, um Folgendes zu überprüfen:
- Der API-Schlüssel ist gültig und der Autorisierungsheader ist korrekt formatiert.
- Die Modell-ID wird ohne 404- oder Modell-nicht-gefunden-Fehler akzeptiert.
- Ihr Client kann
choices[0].message.contentparsen. - Die Token-Nutzung wird protokolliert, sodass Sie die Kosten ab der ersten Anfrage überwachen können.
Python-Beispiel für Kimi K2.7 Code
Das OpenAI Python SDK funktioniert mit Novita AI, wenn Sie die Novita-Basis-URL setzen. Fixieren Sie die SDK-Version gemäß Ihrer eigenen Abhängigkeitsrichtlinie.
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "Sie sind ein präziser Code-Review-Assistent."},
{
"role": "user",
"content": "Überprüfen Sie diese Python-Funktion auf Off-by-one-Fehler und fehlende Randfälle:\n\ndef get_items(lst, start, end):\n return lst[start:end]",
},
],
max_tokens=512,
temperature=0.2,
)
print(response.choices[0].message.content)
print("Verwendete Token:", response.usage.total_tokens)
Setzen Sie für lange Coding-Agent-Sitzungen max_tokens explizit. Kimi K2.7 Code unterstützt bis zu 262.144 Ausgabetoken, aber Produktionsagenten sollten die Token-Nutzung pro Durchlauf budgetieren und die kumulativen Kosten über mehrere Schritte hinweg überwachen.
Bild- und Videoeingabe
Novita listet Text, Bild und Video als Eingabemodalitäten für Kimi K2.7 Code. Verwenden Sie für die Bildeingabe ein content-Array in der Benutzernachricht mit einem text-Teil und einem image_url-Teil:
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "Sie sind ein UI-Code-Review-Assistent."},
{
"role": "user",
"content": [
{
"type": "text",
"text": "Beschreiben Sie alle auf diesem UI-Screenshot sichtbaren Barrierefreiheitsprobleme und schlagen Sie CSS-Korrekturen vor.",
},
{
"type": "image_url",
"image_url": {"url": "https://example.com/screenshot.png"},
},
],
},
],
max_tokens=512,
)
print(response.choices[0].message.content)
Eine praktische Reihenfolge für die multimodale Integration:
- Bestätigen Sie zuerst, dass der reine Text-Smoke-Test funktioniert.
- Fügen Sie eine Bildeingabe mit einer klar überprüfbaren Aufgabe hinzu, z. B. dem Extrahieren von Labels aus einem UI-Screenshot.
- Validieren Sie sowohl die Antwortqualität als auch die Antwortstruktur für Ihre tatsächliche Arbeitslast.
- Testen Sie Videoeingaben separat – beginnen Sie mit kurzen Clips, überprüfen Sie das Anfrageformat und messen Sie Latenz und Token-Kosten, bevor Sie Video zu einem Produktionspfad hinzufügen.
Gehen Sie nicht davon aus, dass jede OpenAI-kompatible multimodale Nutzlast von jedem von Novita gehosteten Modell identisch akzeptiert wird. Überprüfen Sie die genaue Bild- und Video-Nutzlaststruktur in der aktuellen Novita AI Dokumentation oder in Konsolenbeispielen für moonshotai/kimi-k2.7-code, bevor Sie ausliefern.
Function Calling und Structured Outputs
Kimi K2.7 Code unterstützt Function Calling über den tools-Parameter und Structured Outputs über response_format. Beide sind auf der Novita AI Modellseite als Funktionen aufgeführt.
Verwenden Sie Function Calling, wenn das Modell ein Werkzeug auswählen und strukturierte Argumente zurückgeben soll, anstatt in Prosa zu antworten:
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
tools = [
{
"type": "function",
"function": {
"name": "file_search",
"description": "Durchsuchen Sie das Repository nach Dateien, die einem Muster entsprechen.",
"parameters": {
"type": "object",
"properties": {
"pattern": {
"type": "string",
"description": "Glob-Muster für die Suche, z. B. '**/*.py'",
},
"directory": {
"type": "string",
"description": "Stammverzeichnis für die Suche.",
},
},
"required": ["pattern"],
},
},
}
]
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "Sie sind ein Repository-Analyse-Assistent."},
{
"role": "user",
"content": "Finden Sie alle Python-Dateien im src-Verzeichnis, die Datenbankmigrationslogik enthalten könnten.",
},
],
tools=tools,
tool_choice="auto",
temperature=0.1,
)
message = response.choices[0].message
if message.tool_calls:
for call in message.tool_calls:
print(f"Werkzeug: {call.function.name}")
print(f"Argumente: {call.function.arguments}")
else:
print(message.content)
Verwenden Sie für Structured Outputs response_format mit json_schema, wenn Sie eine validierte JSON-Antwort ohne Tool-Aufruf benötigen. Halten Sie frühe Schemas klein und testen Sie Ihren Parser gegen die genaue Antwortstruktur, die moonshotai/kimi-k2.7-code zurückgibt, bevor Sie sich in der Produktion auf den strikten Modus verlassen.
Kimis verschachtelte Denkarchitektur bedeutet, dass es bei mehrstufigen Aufgaben Schlussfolgerungen zieht, bevor es ein Ergebnis zurückgibt. Testen Sie für agentische Coding-Workflows mit mehreren Tool-Aufrufen pro Durchlauf, wie sich Tool-Auswahl, Argumentqualität und Antwortlatenz bei Ihrem tatsächlichen Aufgabensatz verhalten, bevor Sie Produktionsverkehr weiterleiten.
Produktionstest-Checkliste
Kimi K2.7 Code wird separat für Eingabe-, Ausgabe- und Cache-Lese-Token abgerechnet. Kostenprofile variieren je nach Arbeitslast erheblich:
- Langkontext-Code-Review: Hohe Eingabe-Token-Anzahlen dominieren die Kosten.
- Code-Generierungsagenten: Die Ausgabe-Token-Nutzung skaliert mit der Antwortlänge und der Anzahl der Durchläufe.
- Workflows mit wiederholtem Kontext: Cache-Lese-Preise gelten, wenn ein stabiler System-Prompt, Tool-Schema oder Repository-Überblick über viele Aufrufe hinweg wiederkehrt.
Führen Sie vor der Produktion einen Evaluierungssatz durch, der Folgendes umfasst:
- Kurze reine Text-Prompts (Latenz-Baseline und Authentifizierungsprüfung).
- Langkontext-Prompts nahe Ihrer erwarteten Arbeitsgröße, nicht dem maximalen Fenster.
- Tool-Call-Prompts, bei denen das korrekte Verhalten das Aufrufen einer Funktion mit gültigen Argumenten ist.
- Bildeingaben, die Ihrer tatsächlichen Upload-Quelle und Dateiverarbeitung entsprechen.
- Fehlerfälle: zu große Eingabe, fehlende Medien-URL, ungültiger API-Schlüssel und Timeout-Verhalten.
Funktionslisten beschreiben, was verfügbar ist. Die Evaluierung an Ihrer tatsächlichen Arbeitslast zeigt Ihnen, ob Latenz, Token-Nutzung, Tool-Argumentqualität und Ausgabekorrektheit Ihre Produktionsanforderungen erfüllen.
FAQ
Ist Kimi K2.7 Code über Novita AI verfügbar?
Ja. Novita AI listet Kimi K2.7 Code als Serverless LLM mit der API-Modell-ID moonshotai/kimi-k2.7-code.
Was ist die korrekte Modell-ID?
Verwenden Sie moonshotai/kimi-k2.7-code in allen API-Aufrufen.
Welchen Endpunkt sollte ich verwenden?
Verwenden Sie den OpenAI-kompatiblen Chat-Completions-Endpunkt: POST https://api.novita.ai/openai/v1/chat/completions. Setzen Sie die Basis-URL auf https://api.novita.ai/openai, wenn Sie ein OpenAI SDK verwenden.
Wie viel kostet Kimi K2.7 Code?
Stand 16. Juni 2026 listet Novita AI 0,95 $ pro 1 Mio. Eingabetoken, 4,00 $ pro 1 Mio. Ausgabetoken und 0,19 $ pro 1 Mio. Cache-Lese-Eingabetoken. Überprüfen Sie die aktuellen Preise auf der Kimi K2.7 Code Modellseite, bevor Sie Beschaffungsentscheidungen treffen.
Unterstützt es Bild- und Videoeingabe?
Novita listet Text, Bild und Video als Eingabemodalitäten. Überprüfen Sie die genaue Nutzlaststruktur in der aktuellen Novita-Dokumentation oder mit einem Testaufruf, bevor Sie multimodale Funktionen ausliefern.
Unterstützt Kimi K2.7 Code Function Calling?
Ja. Verwenden Sie den tools-Parameter in der Chat-Completions-Anfrage. Novita listet Function Calling und Structured Outputs als unterstützte Funktionen.
Was ist das Kontextfenster?
262.144 Token Kontextfenster und 262.144 Token maximale Ausgabe, wie auf der Novita AI Modellseite angegeben.
