Claude API-Preise vs. Abonnementpläne: Vollständiger Preisleitfaden 2026

Inhaltsverzeichnis

Claude-API-Preise nach Modell
Claude Code-Abonnementkosten
Wie sich API-Token-Kosten summieren
Batch- und Caching-Rabatte
Den richtigen Plan oder die richtige Modellstufe wählen
Die Novita AI LLM API als Kostenalternative nutzen
FAQ
Empfohlene Artikel

Claude-API-Preise nach Modell

API-Zugriff erfolgt nutzungsabhängig, abgerechnet pro Million Token (MTok). Eingabe- und Ausgabetoken werden getrennt berechnet. Stand Juli 2026 sind die aktiven Modellstufen:

Modell	Eingabe ($/MTok)	Ausgabe ($/MTok)	Kontextfenster	Maximale Ausgabe
Claude Opus 4.7	$5.00	$25.00	1 Mio. Token	128K Token
Claude Sonnet 4.6	$3.00	$15.00	1 Mio. Token	128K Token
Claude Haiku 4.5	$1.00	$5.00	200K Token	64K Token

Ein durchgängiges Muster: Ausgabetoken kosten auf jeder Stufe das Fünffache des Eingabepreises. Dieses Verhältnis ist für die Kostenschätzung wichtig – ein Workflow, der lange Ausgaben erzeugt, verbraucht den Großteil des Token-Budgets für die Ausgabe.

Praktische Schätzungen pro Aufruf für eine typische Aufgabe (4.000 Eingabe-Token + 500 Ausgabe-Token):

Haiku 4.5: ~$0,0065
Sonnet 4.6: ~$0,019
Opus 4.7: ~$0,032

Hochgerechnet auf 100.000 Aufrufe/Monat beträgt der Unterschied zwischen Haiku und Opus etwa $650 vs. $3.200 – bei identischem Aufgabenvolumen.

Claude Code-Abonnementkosten

Claude Code, Anthropics terminalbasiertes Codierungs-Agent, ist im Pro-Plan und höher enthalten – es gibt keine eigenständige kostenlose Stufe. Was sich zwischen den Plänen unterscheidet, ist die Nutzungstiefe:

Pro ($20/Monat): Claude Code-Zugriff inklusive, aber komplexe dateiübergreifende oder längerfristige Aufgaben können das Nutzungslimit schnell erschöpfen.
Max 5x ($100/Monat): 5-fache Nutzung von Pro, geeignet für aktive tägliche Codierungssitzungen.
Max 20x ($200/Monat): Für Entwickler, die Claude Code als primären IDE-Assistenten über den Arbeitstag hinweg verwenden.
Team Premium ($125/Platz/Monat): Claude Code für Teams mit gemeinsamem Arbeitsbereich und Verwaltungskontrollen.

Eine Klarstellung: Das Abonnement steuert, wie viel Sie Claude Code über die Oberfläche nutzen können. Wenn Sie Ihren eigenen Codierungs-Agent auf Basis der Anthropic-API entwickeln, fallen diese Kosten separat an und werden pro Token abgerechnet.

Wie sich API-Token-Kosten summieren

Die Token-Mathematik wird schnell unübersichtlich, insbesondere bei kontextintensiven Aufgaben.

Der Kontext ist wichtiger als die Abschlusslänge. Wenn Sie pro Aufruf 100.000 Token Kontext übergeben und nur 2.000 Token zurückerhalten, geben Sie bei Opus 4.7 allein für die Eingabe $0,50 pro Aufruf aus. Entwickler, die Dokumenten-Q&A, Code-Reviews oder Tools zur Zusammenfassung langer Kontexte erstellen, müssen die Eingabekosten als primäre Variable behandeln, nicht die Ausgabe.

Agentische Schleifen vervielfachen die Tokenzahl. Eine einzige Claude Code-Sitzung, die eine Codebasis liest, Dateien überarbeitet und Überprüfungsschritte ausführt, kann 50.000–200.000 Token über die gesamte Konversation hinweg erzeugen. Planen Sie entsprechend.

Die Modellwahl ist der größte Kostenhebel. Bevor Sie eine Arbeitslast Opus 4.7 zuweisen, testen Sie, ob Haiku 4.5 oder Sonnet 4.6 eine akzeptable Qualität erreicht. Viele Klassifikations-, Extraktions- und Zusammenfassungsaufgaben funktionieren gut mit Haiku bei 80% niedrigeren Kosten pro Token.

Batch- und Caching-Rabatte

Anthropic bietet zwei strukturierte Wege zur Kostensenkung:

Prompt Caching

Für wiederholte Kontexte (System-Prompts, Referenzdokumente, Codebasis-Snapshots) vermeidet Prompt Caching die erneute Berechnung des vollen Eingabepreises für gecachte Token. Die Cache-Leseraten sind deutlich niedriger – etwa 90% Ersparnis beim gecachten Anteil für häufig wiederverwendete Prompts. Cache-Schreibvorgänge haben einen kleinen Aufschlag; die Wirtschaftlichkeit ist gegeben, wenn derselbe Kontextblock in vielen Aufrufen vorkommt.

Batch-API

Die Batch-API verarbeitet Anfragen asynchron und liefert Ergebnisse innerhalb von 24 Stunden. Aktueller Rabatt: 50% auf sowohl Eingabe- als auch Ausgabetoken bei unterstützten Modellen. Dies eignet sich direkt für Evaluierungspipelines, Masseninhaltserstellung, nächtliche Datenverarbeitung und alle Arbeitslasten, bei denen keine Echtzeit-Latenz erforderlich ist.

Kombination beider Verfahren: Eine Dokumentenanalyse-Pipeline, die einen großen System-Prompt wiederverwendet und Anfragen in Batches verarbeitet, kann die effektiven Token-Kosten um 70–80% im Vergleich zu synchronen, nicht gecachten Aufrufen senken.

Den richtigen Plan oder die richtige Modellstufe wählen

Einige Entscheidungsregeln, die tatsächlich Bestand haben:

Wenn Sie Claude ein paar Mal pro Woche für Chat und leichtes Programmieren nutzen: Pro für $20/Monat reicht normalerweise aus. Der Jahrestarif bringt es auf ~$17/Monat.

Wenn Claude Code Ihre primäre Programmierumgebung ist: Beginnen Sie mit Max 5x ($100/Monat). Steigen Sie zuerst auf Pro um und beobachten Sie, ob Sie innerhalb einer Woche an Grenzen stoßen – wenn ja, upgraden Sie.

Wenn Sie ein API-basiertes Produkt entwickeln: Zahlen Sie kein Abonnement als Ersatz für API-Kosten. Diese sind getrennt. Kaufen Sie Guthaben, nutzen Sie die Batch-API für nicht-echtzeit Jobs und wählen Sie das günstigste Modell, das die Qualitätsschwelle für Ihre spezifische Aufgabe erreicht.

Für Teams: Team Standard deckt die meisten Zusammenarbeitsanforderungen ab. Team Premium ist nur sinnvoll, wenn Entwickler Claude Code in voller Nutzungstiefe benötigen – der Jahrestarif von $100/Platz entspricht in etwa einem individuellen Max 5x-Plan.

Für Unternehmen: Verhandeln Sie über das Volumen, nicht über die Stufe. Der ausgewiesene Preis pro Platz ist ein Ausgangspunkt, keine Obergrenze.

Die Novita AI LLM API als Kostenalternative nutzen

Für Entwickler, die mit Open-Source-Modellen arbeiten oder kosten sensible Arbeitslasten betreiben, bietet die Novita AI LLM API einen OpenAI-kompatiblen Endpunkt für Modelle wie Llama, Qwen, DeepSeek und GLM zu wesentlich niedrigeren Token-Kosten. Die Eingabepreise beginnen bei $0,02/Millionen Token für kleinere Modelle, und leistungsfähige Modelle mittlerer Größe wie die Qwen3- und DeepSeek V3-Serie liegen bei unter $0,50/Millionen Token für die Eingabe.

Dies ist für Claude Code-Nutzer praktisch relevant: Mehrere Open-Source-Modelle können über die API-Kompatibilitätsschicht als Claude Code-Backends verwendet werden, was die Token-Kosten pro Sitzung erheblich senkt. Beispielsweise läuft GLM-5 auf Novita AI zu $1,00/$3,20 pro Million Token – ein Bruchteil des Opus 4.7-Satzes – und wurde speziell für agentische Codierungs-Workflows getestet. Siehe Anleitung zur Verwendung von GLM-5 in Claude Code für ein Setup-Handbuch.

Für Teams, die mehrstufige Agenten betreiben, bietet die Novita Agent Sandbox verwaltete Ausführungsumgebungen für Browserautomatisierung, Codeausführung und Dateioperationen – die Infrastrukturebene, die API-Aufrufe allein nicht abdecken. Speziell zu den Preismodellen für Agent-Sandbox-Infrastruktur siehe KI-Agent-Sandbox-Preismodelle.

Wenn Budgetoptimierung die Haupttriebfeder ist, finden Sie unter Top 10 der günstigsten LLM-APIs 2026 einen Ranking-Vergleich verschiedener Anbieter.

FAQ

Wie viel kostet Claude pro Monat?

Claude kostet $0 (Free), $20 (Pro), $100 (Max 5x) oder $200 (Max 20x) pro Monat für Einzelpläne. Teampläne beginnen bei $25/Platz (Standard) oder $125/Platz (Premium). Enterprise-Preise sind individuell.

Wie lauten die API-Preise von Claude?

Stand Juli 2026: Haiku 4.5 zu $1/$5 pro Million Token (Eingabe/Ausgabe), Sonnet 4.6 zu $3/$15 und Opus 4.7 zu $5/$25. Alle Tarife sind nutzungsabhängig ohne monatliches Minimum.

Wie viel kostet Claude Pro?

$20/Monat bei monatlicher Abrechnung oder etwa $17/Monat bei einem Jahresplan.

Wie lauten die Preise für Claude Max?

Max 5x kostet $100/Monat und Max 20x kostet $200/Monat. Beides sind Einzelpläne für intensive Claude-Nutzung einschließlich Claude Code. Für Max-Stufen ist derzeit keine jährliche Abrechnungsoption aufgeführt.

Wie viel kostet Claude Code?

Claude Code ist in Pro ($20/Monat) und höher enthalten. Es gibt keine kostenlose Stufe. Team Premium ($125/Platz/Monat) ist die empfohlene Stufe für Entwicklungsteams, die vollständigen Claude Code-Zugriff benötigen.

Wie lauten die Preise für Anthropic Claude Opus 4 über die API?

Claude Opus 4.7 (die aktuelle Opus 4-Veröffentlichung) kostet $5,00/MTok Eingabe und $25,00/MTok Ausgabe. Prompt Caching- und Batch-API-Rabatte sind anwendbar.

Wie lauten die Preise für Claude Sonnet 4?

Claude Sonnet 4.6 kostet $3,00/MTok Eingabe und $15,00/MTok Ausgabe.

Bietet Anthropic Mengenrabatte?

Ja, über zwei Mechanismen: die Batch-API (50% Rabatt auf Eingabe und Ausgabe für asynchrone Verarbeitung) und Prompt Caching (bis zu 90% Ersparnis bei wiederholten Kontextblöcken). Enterprise-Verträge können auch ausgehandelte Preisobergrenzen enthalten.

Wie hoch sind die Anthropic-API-Kosten bei großem Maßstab?

Bei 10 Millionen Aufrufen/Monat mit 4K Eingabe + 500 Ausgabe-Token pro Aufruf: Haiku 4.5 summiert sich auf ~$65.000/Monat vor Rabatten; Sonnet 4.6 ~$195.000; Opus 4.7 ~$320.000. Batch-API-Rabatte halbieren diese Beträge für nicht-echtzeit Arbeitslasten ungefähr.

Claude API-Preise vs. Abonnementpläne: Vollständiger Preisleitfaden 2026

Claude-API-Preise nach Modell

Claude Code-Abonnementkosten

Wie sich API-Token-Kosten summieren

Batch- und Caching-Rabatte

Prompt Caching

Batch-API

Den richtigen Plan oder die richtige Modellstufe wählen

Die Novita AI LLM API als Kostenalternative nutzen

FAQ

Empfohlene Artikel

Product

RESOURCES

Partners

Company

Claude-API-Preise nach Modell

Claude Code-Abonnementkosten

Wie sich API-Token-Kosten summieren

Batch- und Caching-Rabatte

Prompt Caching

Batch-API

Den richtigen Plan oder die richtige Modellstufe wählen

Die Novita AI LLM API als Kostenalternative nutzen

FAQ

Empfohlene Artikel

Ähnliche Beiträge

Product

RESOURCES

Partners

Company