So verwenden Sie Kimi K2.7 Code in Claude Code über Novita AI

Inhaltsverzeichnis

Warum Kimi K2.7 Code in Claude Code verwenden?
Kimi K2.7 Code Spezifikationen auf einen Blick
Wie viel kostet Kimi K2.7 Code bei Novita AI?
Schritt 1: Holen Sie sich Ihren Novita AI API-Schlüssel
Schritt 2: Claude Code installieren
Schritt 3: Umgebungsvariablen konfigurieren
Schritt 4: Claude Code starten
Praktische Tipps für den Codierungs-Workflow
Fehlerbehebung
FAQ
Empfohlene Artikel

Kimi K2.7 Code ist ein auf Codierung spezialisiertes MoE-Modell von MoonshotAI mit einem 256K-Kontextfenster, interleaved Thinking und mehrstufigem Tool Calling. Über den Anthropic-kompatiblen Endpunkt von Novita AI können Sie es direkt in Claude Code einbinden – Ihr bestehender Workflow bleibt erhalten, während Sie zu einem Modell wechseln, das speziell für agentisches Codieren entwickelt wurde, zu einem Bruchteil des Preises von Claude Sonnet.

Diese Anleitung führt Sie durch jeden Schritt: API-Schlüssel abrufen, Umgebungsvariablen einrichten und Claude Code mit moonshotai/kimi-k2.7-code als Modell starten.

Warum Kimi K2.7 Code in Claude Code verwenden?

Claude Code verwendet unter der Haube das Anthropic SDK, daher benötigt es einen Anthropic-kompatiblen Endpunkt – keinen OpenAI-kompatiblen. Novita AI bietet genau das unter https://api.novita.ai/anthropic an, sodass Kimi K2.7 Code ohne Wrapper-Bibliotheken oder zusätzliche Tools als Drop-in-Modell für Claude Code fungiert. Informationen zur OpenAI-kompatiblen API-Einrichtung finden Sie im Kimi K2.7 Code API Quick Start.

Die praktische Begründung lässt sich auf drei Punkte reduzieren:

Kosten. Mit 0,95 $ pro Million Eingabe-Token und 4,00 $ pro Million Ausgabe-Token bei Novita AI (Stand Juni 2026) ist Kimi K2.7 Code etwa 68 % günstiger beim Input und 73 % günstiger beim Output als Claude Sonnet 4.5 (3,00 $/15,00 $ pro Million Token). Für Teams, die täglich hunderte Codierungsaufgaben ausführen, ist dieser Unterschied signifikant.

Kontext. Das 256K-Token-Kontextfenster ermöglicht es, umfangreichen Repository-Kontext zu senden – mehrere Dateien, Testausgaben, Architekturnotizen – ohne mitten in der Sitzung an eine Grenze zu stoßen. Die meisten alltäglichen Codierungsagenten arbeiten gut innerhalb von 32K–64K Token; 256K zu haben bedeutet, dass Sie selten Kontext kürzen müssen.

Codierungsspezialisierung. Kimi K2.7 Code ist speziell für Codierungs- und agentische Workflows konzipiert, kein Allzweckmodell. Seine interleaved Thinking-Architektur generiert ~30 % weniger Thinking-Token als Kimi K2.6, was bei mehrstufigen Codierungsaufgaben zu schnelleren Antworten führt.

Kimi K2.7 Code Spezifikationen auf einen Blick

Feld	Wert
Modell-ID	`moonshotai/kimi-k2.7-code`
Architektur	Mixture of Experts (MoE)
Gesamtparameter	1T
Aktivierte Parameter	32B pro Token
Kontextfenster	262.144 Token (~256K)
Maximale Ausgabe-Token	262.144 Token
Eingabemodalitäten	Text, Bild, Video
Ausgabemodalität	Text
Funktionen	Function Calling, strukturierte Ausgaben, Reasoning (interleaved Thinking)
Endpunkte bei Novita AI	`chat/completions`, `anthropic`

Für Claude Code verwenden Sie die anthropic-Endpunktfamilie – das erwartet das Anthropic SDK.

Wie viel kostet Kimi K2.7 Code bei Novita AI?

Tokentyp	Novita AI Preis	Claude Sonnet 4.5 Preis
Input	0,95 $ / 1M	3,00 $ / 1M
Cache-Lese-Input	0,19 $ / 1M	—
Output	4,00 $ / 1M	15,00 $ / 1M

Preise basierend auf der Kimi K2.7 Code Modellseite bei Novita AI Stand Juni 2026. Novita AI listet auch Cache-Lese-Preise, was für wiederholte Kontext-Workflows wie Agenten, die dasselbe System-Prompt und Tool-Schema über viele Aufrufe hinweg wiederverwenden, relevant ist.

Schritt 1: Holen Sie sich Ihren Novita AI API-Schlüssel

Registrieren Sie sich für ein Novita AI-Konto – neue Konten erhalten kostenlose Testguthaben.

Nach der Anmeldung:

Gehen Sie zu Key Management in Ihrem Dashboard.
Klicken Sie auf Create New Key (Neuen Schlüssel erstellen).
Kopieren Sie den Schlüssel sofort und speichern Sie ihn an einem sicheren Ort – er wird nur einmal angezeigt.

Sie werden diesen Schlüssel im nächsten Schritt als ANTHROPIC_AUTH_TOKEN verwenden.

Schritt 2: Claude Code installieren

Claude Code benötigt Node.js 18 oder höher. Überprüfen Sie zuerst Ihre Version:

node --version

Installieren Sie Claude Code global:

npm install -g @anthropic-ai/claude-code

Überprüfen Sie die Installation:

claude --version

Schritt 3: Umgebungsvariablen konfigurieren

Claude Code liest vier Umgebungsvariablen, um zu wissen, welcher Endpunkt, API-Schlüssel und welches Modell verwendet werden sollen. Setzen Sie alle vier – ANTHROPIC_SMALL_FAST_MODEL steuert, welches Modell Claude Code für leichte Unteraufgaben wie Zusammenfassungen und schnelle Bearbeitungen verwendet.

Mac und Linux

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="YOUR_NOVITA_API_KEY"
export ANTHROPIC_MODEL="moonshotai/kimi-k2.7-code"
export ANTHROPIC_SMALL_FAST_MODEL="moonshotai/kimi-k2.7-code"

Um diese dauerhaft zu machen, fügen Sie die vier Zeilen zu ~/.zshrc oder ~/.bashrc hinzu und führen Sie dann source ~/.zshrc (oder ~/.bashrc) aus.

Windows (Eingabeaufforderung)

set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=YOUR_NOVITA_API_KEY
set ANTHROPIC_MODEL=moonshotai/kimi-k2.7-code
set ANTHROPIC_SMALL_FAST_MODEL=moonshotai/kimi-k2.7-code

Diese Umgebungsvariablen gelten nur für die aktuelle Sitzung. Für eine dauerhafte Einrichtung unter Windows fügen Sie sie über Systemeigenschaften → Umgebungsvariablen hinzu.

Was jede Variable bewirkt

Variable	Wert	Zweck
`ANTHROPIC_BASE_URL`	`https://api.novita.ai/anthropic`	Leitet Claude Code zum Anthropic-kompatiblen Endpunkt von Novita AI
`ANTHROPIC_AUTH_TOKEN`	Ihr Novita API-Schlüssel	Authentifiziert Ihre Anfragen
`ANTHROPIC_MODEL`	`moonshotai/kimi-k2.7-code`	Setzt das primäre Modell für Codierungsaufgaben
`ANTHROPIC_SMALL_FAST_MODEL`	`moonshotai/kimi-k2.7-code`	Setzt das Modell für leichte Unteraufgaben

Schritt 4: Claude Code starten

Navigieren Sie zu Ihrem Projektverzeichnis und starten Sie eine Sitzung:

cd your-project-directory
claude .

Claude Code öffnet eine interaktive Eingabeaufforderung. Sie können nun Aufgaben in einfachem Englisch beschreiben – ein Feature implementieren, einen Bug beheben, ein Modul umgestalten, Tests schreiben – und Kimi K2.7 Code übernimmt das Reasoning und die Codegenerierung über den Endpunkt von Novita AI.

Um zu überprüfen, ob das Modell korrekt weitergeleitet wird, führen Sie /status innerhalb der Claude Code-Sitzung aus. Es sollte die konfigurierte Basis-URL und das Modell anzeigen.

Praktische Tipps für den Codierungs-Workflow

Senden Sie mehr Kontext im Voraus. Mit 256.000 verfügbaren Token können Sie den vollständigen Inhalt relevanter Dateien anstelle von Auszügen einschließen. Claude Code kann auf den tatsächlichen Code verweisen, anstatt aus Zusammenfassungen zu schließen, was Halluzinationen bei Implementierungsdetails reduziert.

Verwenden Sie interleaved Thinking für komplexe Aufgaben. Kimi K2.7 Code führt schrittweise Reasoning durch, bevor Code generiert wird. Bei dateiübergreifenden Refactorings oder Architekturentscheidungen geben Sie dem Modell genügend Kontext, um das gesamte Bild zu sehen – es wird vor dem Schreiben planen, was Nachbesserungen reduziert.

Multimodales Debugging. Kimi K2.7 Code akzeptiert Bilder und Videos als Eingabe. Wenn Ihr Workflow Screenshot-basierte Fehlerberichte oder UI-Überprüfungsaufgaben umfasst, können Sie diese direkt in die Sitzung einspeisen. Antworten sind immer Text, daher ist die Ausgabe Code, Pläne oder Analysen.

Cache-intensive System-Prompts. Wenn Sie über viele Sitzungen hinweg ein konsistentes System-Prompt verwenden – Codierungsstandards, Projektkonventionen, Architekturnotizen – greift die Cache-Lese-Preisgestaltung von Novita AI zu 0,19 $ pro Million Token für wiederholte Inhalte. Für Teams mit langen, stabilen System-Prompts reduziert dies die Kosten pro Aufgabe erheblich.

Bleiben Sie für die Konsistenz bei einem Modell. Setzen Sie sowohl ANTHROPIC_MODEL als auch ANTHROPIC_SMALL_FAST_MODEL auf moonshotai/kimi-k2.7-code, um ein konsistentes Verhalten über Hauptaufgabe und Unteraufgaben hinweg zu gewährleisten. Wenn Sie später ein leichteres Modell für Unteraufgaben verwenden möchten, um Kosten zu sparen, können Sie nur ANTHROPIC_SMALL_FAST_MODEL austauschen.

Fehlerbehebung

401 Nicht autorisiert

Ihr API-Schlüssel ist falsch oder abgelaufen. Überprüfen Sie den Schlüssel unter Novita AI Key Management. Achten Sie beim Kopieren des Schlüssels auf zusätzliche Leerzeichen oder Zeilenumbrüche.

Modell nicht gefunden / 404

Stellen Sie sicher, dass die Modell-ID exakt moonshotai/kimi-k2.7-code lautet – keine zusätzlichen Leerzeichen, korrekte Groß-/Kleinschreibung. Sie können sie auf der Kimi K2.7 Code Modellseite überprüfen.

Langsame Antworten bei langen Prompts

Aktivieren Sie Streaming standardmäßig in Claude Code – die meisten Konfigurationen tun dies automatisch. Bei sehr langen Kontexteingaben (100K+ Token) erhöht sich die anfängliche Antwortlatenz. Erwägen Sie, zuerst minderprioritären Kontext zu kürzen.

Umgebungsvariablen werden nicht übernommen

Unter Mac/Linux stellen Sie sicher, dass Sie die Profildatei nach der Bearbeitung gesourced haben (source ~/.zshrc). Unter Windows gelten mit set gesetzte Umgebungsvariablen nur für die aktuelle Eingabeaufforderungssitzung – verwenden Sie das Systemeigenschaften-Panel für dauerhafte Variablen.

FAQ

Funktioniert Kimi K2.7 Code mit Claude Code’s Tool Use und MCP-Integrationen?

Ja. Kimi K2.7 Code unterstützt Function Calling über den Anthropic-kompatiblen Endpunkt von Novita AI, den Claude Code für Tool-Aufrufe und MCP-Integrationen verwendet.

Warum den Anthropic-Endpunkt anstelle des OpenAI-kompatiblen verwenden?

Claude Code basiert auf dem Anthropic SDK. Es kommuniziert im Anthropic-Nachrichtenformat, nicht im OpenAI-Format. Der Endpunkt https://api.novita.ai/anthropic von Novita AI übersetzt dieses Format, sodass Claude Code ohne Änderungen funktioniert.

Wie schneidet Kimi K2.7 Code im Vergleich zu Kimi K2.5 für Claude Code ab?

Kimi K2.7 Code generiert etwa 30 % weniger Thinking-Token als K2.6 (und verbessert die Effizienz gegenüber K2.5), während die Codierungsqualität erhalten bleibt. Bei Claude Code-Sitzungen mit wiederholten mehrstufigen Aufgaben bedeuten weniger Thinking-Token schnellere Antworten und niedrigere Token-Kosten pro Aufgabe.

Kann ich dieses Setup in VS Code oder Cursor verwenden?

Ja. Claude Code integriert sich über Plugins und das Terminal in VS Code und Cursor. Die gleiche Umgebungsvariablenkonfiguration gilt – einmal gesetzt, verwenden sowohl IDE-Integrationen als auch das Standalone-Terminal das konfigurierte Modell.

Novita AI ist eine KI-Cloud-Plattform, die Entwicklern einen einfachen Zugang zu modernsten Modellen über eine einfache API mit erschwinglicher und zuverlässiger GPU-Infrastruktur bietet.

So verwenden Sie Kimi K2.7 Code in Claude Code über Novita AI

Warum Kimi K2.7 Code in Claude Code verwenden?

Kimi K2.7 Code Spezifikationen auf einen Blick

Wie viel kostet Kimi K2.7 Code bei Novita AI?

Schritt 1: Holen Sie sich Ihren Novita AI API-Schlüssel

Schritt 2: Claude Code installieren

Schritt 3: Umgebungsvariablen konfigurieren

Mac und Linux

Windows (Eingabeaufforderung)

Was jede Variable bewirkt

Schritt 4: Claude Code starten

Praktische Tipps für den Codierungs-Workflow

Fehlerbehebung

FAQ

Empfohlene Artikel

Product

RESOURCES

Partners

Company

Warum Kimi K2.7 Code in Claude Code verwenden?

Kimi K2.7 Code Spezifikationen auf einen Blick

Wie viel kostet Kimi K2.7 Code bei Novita AI?

Schritt 1: Holen Sie sich Ihren Novita AI API-Schlüssel

Schritt 2: Claude Code installieren

Schritt 3: Umgebungsvariablen konfigurieren

Mac und Linux

Windows (Eingabeaufforderung)

Was jede Variable bewirkt

Schritt 4: Claude Code starten

Praktische Tipps für den Codierungs-Workflow

Fehlerbehebung

FAQ

Empfohlene Artikel

Ähnliche Beiträge

Product

RESOURCES

Partners

Company