- Warum Kimi K2.7 Code in Claude Code verwenden?
- Kimi K2.7 Code – Technische Daten auf einen Blick
- Wie viel kostet Kimi K2.7 Code bei Novita AI?
- Schritt 1: Holen Sie sich Ihren Novita AI API-Schlüssel
- Schritt 2: Claude Code installieren
- Schritt 3: Umgebungsvariablen konfigurieren
- Schritt 4: Claude Code starten
- Praktische Tipps für den Codierungs-Workflow
- Fehlerbehebung
- FAQ
- Empfohlene Artikel
Kimi K2.7 Code ist ein auf Codierung spezialisiertes MoE-Modell von MoonshotAI mit einem 256K-Kontextfenster, verschachteltem Denken (Interleaved Thinking) und mehrstufigem Toolaufruf. Über den Anthropic-kompatiblen Endpunkt von Novita AI können Sie es direkt in Claude Code einbinden – Sie behalten Ihren bestehenden Workflow bei und tauschen lediglich das Modell gegen eines aus, das speziell für agentische Codierung entwickelt wurde, und das zu einem Bruchteil des Preises von Claude Sonnet.
Diese Anleitung führt Sie durch jeden Schritt: API-Schlüssel beschaffen, Umgebungsvariablen setzen und Claude Code mit moonshotai/kimi-k2.7-code als Modell starten.
Warum Kimi K2.7 Code in Claude Code verwenden?
Claude Code nutzt unter der Haube das Anthropic SDK und benötigt daher einen Anthropic-kompatiblen Endpunkt – keinen OpenAI-kompatiblen. Novita AI stellt genau diesen unter https://api.novita.ai/anthropic bereit und macht Kimi K2.7 Code zu einem Drop-in-Modell für Claude Code, ohne dass zusätzliche Wrapper-Bibliotheken oder Tools erforderlich sind.
Der praktische Nutzen lässt sich auf drei Punkte reduzieren:
Kosten. Mit 0,95 $ pro Million Input-Tokens und 4,00 $ pro Million Output-Tokens bei Novita AI (Stand Juni 2026) ist Kimi K2.7 Code etwa 68 % günstiger beim Input und 73 % günstiger beim Output im Vergleich zu Claude Sonnet 4.5 (3,00 $/15,00 $ pro Million Tokens). Für Teams, die täglich hunderte Codierungsaufgaben ausführen, macht dieser Unterschied einiges aus.
Kontext. Das 256K-Token-Kontextfenster ermöglicht es Ihnen, umfangreichen Repository-Kontext zu senden – mehrere Dateien, Testausgaben, Architekturnotizen – ohne mitten in der Sitzung an eine Grenze zu stoßen. Die meisten alltäglichen Codierungsagenten arbeiten gut innerhalb von 32K–64K Tokens; mit 256K müssen Sie den Kontext nur selten beschneiden.
Codierungs-Spezialisierung. Kimi K2.7 Code ist speziell für Codierungs- und agentische Workflows konzipiert, nicht als allgemeines Modell. Seine Architektur mit verschachteltem Denken erzeugt etwa 30 % weniger Denk-Tokens als Kimi K2.6, was bei mehrstufigen Codierungsaufgaben zu schnelleren Antworten führt.
Kimi K2.7 Code – Technische Daten auf einen Blick
| Feld | Wert |
|---|---|
| Modell-ID | moonshotai/kimi-k2.7-code |
| Architektur | Mixture of Experts (MoE) |
| Parameter gesamt | 1 Billion |
| Aktivierte Parameter | 32 Mrd. pro Token |
| Kontextfenster | 262.144 Tokens (~256K) |
| Maximale Ausgabetokens | 262.144 Tokens |
| Eingabemodalitäten | Text, Bild, Video |
| Ausgabemodalität | Text |
| Funktionen | Funktionsaufruf, strukturierte Ausgaben, Reasoning (verschachteltes Denken) |
| Endpunkte bei Novita AI | chat/completions, anthropic |
Für Claude Code verwenden Sie die Endpunkt-Familie anthropic – das erwartet das Anthropic SDK.
Wie viel kostet Kimi K2.7 Code bei Novita AI?
| Tokentyp | Preis Novita AI | Preis Claude Sonnet 4.5 |
|---|---|---|
| Input | 0,95 $ / 1 Mio. | 3,00 $ / 1 Mio. |
| Cache-Read Input | 0,19 $ / 1 Mio. | — |
| Output | 4,00 $ / 1 Mio. | 15,00 $ / 1 Mio. |
Preise basierend auf der Kimi K2.7 Code Modellseite bei Novita AI (Stand Juni 2026). Novita AI listet auch Cache-Read-Preise, die für Workflows mit wiederholtem Kontext relevant sind, etwa Agenten, die dasselbe System-Prompt und Tool-Schema über viele Aufrufe hinweg wiederverwenden.
Schritt 1: Holen Sie sich Ihren Novita AI API-Schlüssel
Registrieren Sie sich für ein Novita AI-Konto – neue Konten erhalten kostenlose Testguthaben.
Nach dem Einloggen:
- Gehen Sie zu Schlüsselverwaltung in Ihrem Dashboard.
- Klicken Sie auf Neuen Schlüssel erstellen.
- Kopieren Sie den Schlüssel sofort und bewahren Sie ihn sicher auf – er wird nur einmal angezeigt.
Sie verwenden diesen Schlüssel im nächsten Schritt als ANTHROPIC_AUTH_TOKEN.
Schritt 2: Claude Code installieren
Claude Code benötigt Node.js 18 oder höher. Überprüfen Sie zuerst Ihre Version:
node --version
Installieren Sie Claude Code global:
npm install -g @anthropic-ai/claude-code
Überprüfen Sie die Installation:
claude --version
Schritt 3: Umgebungsvariablen konfigurieren
Claude Code liest vier Umgebungsvariablen, um zu wissen, welcher Endpunkt, API-Schlüssel und welches Modell verwendet werden sollen. Setzen Sie alle vier – ANTHROPIC_SMALL_FAST_MODEL steuert, welches Modell Claude Code für leichte Unteraufgaben wie Zusammenfassungen und schnelle Bearbeitungen verwendet.
Mac und Linux
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="IHR_NOVITA_API_SCHLÜSSEL"
export ANTHROPIC_MODEL="moonshotai/kimi-k2.7-code"
export ANTHROPIC_SMALL_FAST_MODEL="moonshotai/kimi-k2.7-code"
Um diese Einstellungen dauerhaft zu machen, fügen Sie die vier Zeilen zu ~/.zshrc oder ~/.bashrc hinzu und führen Sie dann source ~/.zshrc (bzw. ~/.bashrc) aus.
Windows (Eingabeaufforderung)
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=IHR_NOVITA_API_SCHLÜSSEL
set ANTHROPIC_MODEL=moonshotai/kimi-k2.7-code
set ANTHROPIC_SMALL_FAST_MODEL=moonshotai/kimi-k2.7-code
Diese Umgebungsvariablen gelten für die aktuelle Sitzung. Für eine dauerhafte Einrichtung unter Windows fügen Sie sie über Systemsteuerung → Umgebungsvariablen hinzu.
Was jede Variable bewirkt
| Variable | Wert | Zweck |
|---|---|---|
ANTHROPIC_BASE_URL |
https://api.novita.ai/anthropic |
Leitet Claude Code zum Anthropic-kompatiblen Endpunkt von Novita AI |
ANTHROPIC_AUTH_TOKEN |
Ihr Novita API-Schlüssel | Authentifiziert Ihre Anfragen |
ANTHROPIC_MODEL |
moonshotai/kimi-k2.7-code |
Setzt das Hauptmodell für Codierungsaufgaben |
ANTHROPIC_SMALL_FAST_MODEL |
moonshotai/kimi-k2.7-code |
Setzt das Modell für leichte Unteraufgaben |
Schritt 4: Claude Code starten
Navigieren Sie zu Ihrem Projektverzeichnis und starten Sie eine Sitzung:
cd Ihr-Projektverzeichnis
claude .
Claude Code öffnet eine interaktive Eingabeaufforderung. Sie können nun Aufgaben in natürlicher Sprache beschreiben – eine Funktion implementieren, einen Fehler beheben, ein Modul umgestalten, Tests schreiben – und Kimi K2.7 Code übernimmt das Reasoning und die Codegenerierung über den Endpunkt von Novita AI.
Um zu überprüfen, ob das Modell korrekt weitergeleitet wird, führen Sie /status innerhalb der Claude Code-Sitzung aus. Es sollte die konfigurierte Basis-URL und das Modell anzeigen.
Praktische Tipps für den Codierungs-Workflow
Senden Sie mehr Kontext im Voraus. Mit 256K verfügbaren Tokens können Sie den vollständigen Inhalt relevanter Dateien anstelle von Auszügen einfügen. Claude Code kann dann auf den tatsächlichen Code verweisen, anstatt auf Zusammenfassungen zu basieren, was Halluzinationen bei Implementierungsdetails reduziert.
Nutzen Sie verschachteltes Denken für komplexe Aufgaben. Kimi K2.7 Code denkt schrittweise, bevor es Code generiert. Geben Sie dem Modell bei mehrstufigen Refactorings oder Architekturentscheidungen ausreichend Kontext, um das gesamte Bild zu sehen – es plant vor dem Schreiben, was spätere Korrekturen reduziert.
Multimodales Debugging. Kimi K2.7 Code akzeptiert Bilder und Videos als Eingabe. Wenn Ihr Workflow screenshotbasierte Fehlerberichte oder UI-Überprüfungsaufgaben umfasst, können Sie diese direkt in die Sitzung einbinden. Die Antworten sind immer Text, sodass die Ausgabe aus Code, Plänen oder Analysen besteht.
Cache-intensive System-Prompts. Wenn Sie über viele Sitzungen hinweg einen konsistenten System-Prompt verwenden – Codierungsstandards, Projektkonventionen, Architekturnotizen – greift der Cache-Read-Preis von 0,19 $ pro Million Tokens bei wiederholtem Inhalt. Für Teams mit langen, stabilen System-Prompts senkt dies die Kosten pro Aufgabe erheblich.
Bleiben Sie für Konsistenz bei einem Modell. Wenn Sie sowohl ANTHROPIC_MODEL als auch ANTHROPIC_SMALL_FAST_MODEL auf moonshotai/kimi-k2.7-code setzen, bleibt das Verhalten über Hauptaufgabe und Unteraufgaben konsistent. Wenn Sie später ein leichteres Modell für Unteraufgaben verwenden möchten, um Kosten zu sparen, können Sie nur ANTHROPIC_SMALL_FAST_MODEL austauschen.
Fehlerbehebung
401 Nicht autorisiert
Ihr API-Schlüssel ist falsch oder abgelaufen. Überprüfen Sie den Schlüssel unter Novita AI Schlüsselverwaltung. Achten Sie beim Kopieren des Schlüssels auf zusätzliche Leerzeichen oder Zeilenumbrüche.
Modell nicht gefunden / 404
Stellen Sie sicher, dass die Modell-ID exakt moonshotai/kimi-k2.7-code lautet – keine zusätzlichen Leerzeichen, korrekte Groß-/Kleinschreibung. Sie können sie auf der Kimi K2.7 Code Modellseite überprüfen.
Langsame Antworten bei langen Prompts
Aktivieren Sie Streaming standardmäßig in Claude Code – die meisten Konfigurationen tun dies automatisch. Bei sehr langen Kontexteingaben (100K+ Tokens) steigt die anfängliche Antwortlatenz. Erwägen Sie, zuerst Kontext mit niedriger Priorität zu kürzen.
Umgebungsvariablen werden nicht erkannt
Unter Mac/Linux stellen Sie sicher, dass Sie die Profildatei nach dem Bearbeiten mit source geladen haben (source ~/.zshrc). Unter Windows gelten über set gesetzte Umgebungsvariablen nur für die aktuelle Eingabeaufforderungssitzung – verwenden Sie die Systemsteuerung für dauerhafte Variablen.
FAQ
Funktioniert Kimi K2.7 Code mit Claude Codes Tool-Nutzung und MCP-Integrationen?
Ja. Kimi K2.7 Code unterstützt Funktionsaufrufe über den Anthropic-kompatiblen Endpunkt von Novita AI, den Claude Code für Tool-Aufrufe und MCP-Integrationen verwendet.
Warum den Anthropic-Endpunkt anstelle des OpenAI-kompatiblen verwenden?
Claude Code basiert auf dem Anthropic SDK. Es kommuniziert im Anthropic-Nachrichtenformat, nicht im OpenAI-Format. Der Endpunkt https://api.novita.ai/anthropic von Novita AI übersetzt dieses Format, sodass Claude Code ohne Änderungen funktioniert.
Wie schneidet Kimi K2.7 Code im Vergleich zu Kimi K2.5 für Claude Code ab?
Kimi K2.7 Code erzeugt etwa 30 % weniger Denk-Tokens als K2.6 (und verbessert die Effizienz gegenüber K2.5), während die Codierungsqualität erhalten bleibt. Bei Claude Code-Sitzungen mit wiederholten mehrstufigen Aufgaben bedeuten weniger Denk-Tokens schnellere Antworten und niedrigere Tokens-Kosten pro Aufgabe.
Kann ich dieses Setup in VS Code oder Cursor verwenden?
Ja. Claude Code integriert sich über Plugins und das Terminal in VS Code und Cursor. Dieselbe Konfiguration der Umgebungsvariablen gilt – einmal gesetzt, verwenden sowohl die IDE-Integrationen als auch das eigenständige Terminal das konfigurierte Modell.
Novita AI ist eine KI-Cloud-Plattform, die Entwicklern einen einfachen Zugang zu modernsten Modellen über eine einfache API bietet, mit erschwinglicher und zuverlässiger GPU-Infrastruktur.
