Die Preisgestaltung von Claude umfasst zwei verschiedene Bereiche: Abonnementpläne für Einzelpersonen und Teams sowie API-Token-Kosten für Entwickler, die direkt mit den Modellen arbeiten. Wer diese vermischt, trifft schlechte Budgetentscheidungen. Dieser Leitfaden behandelt beide Bereiche: was jeder Plan tatsächlich freischaltet, was du pro Token bei der API zahlst und wo die eigentlichen Kostenmultiplikatoren liegen – einschließlich Claude Code und agentischem Einsatz.
Claude-Abonnementpläne
Anthropic bietet fünf Stufen für den Zugriff auf Claude über claude.ai. Jeder Plan legt ein Nutzungslimit für die Chat-Oberfläche und Claude Code fest – der API-Zugriff wird separat abgerechnet.
| Plan | Monatlicher Preis | Jährlich (pro Monat) | Für wen geeignet |
|---|---|---|---|
| Free (Kostenlos) | $0 | $0 | Leichte persönliche Nutzung |
| Pro | $20 | ~$17 | Regelmäßige Nutzer, Entwickler |
| Max 5x | $100 | — | Schwere tägliche Nutzer |
| Max 20x | $200 | — | Power-User, agentische Workflows |
| Team Standard | $25/Sitzplatz | ~$20/Sitzplatz | Kleine bis mittelgroße Teams |
| Team Premium | $125/Sitzplatz | ~$100/Sitzplatz | Technische Teams mit Claude Code-Bedarf |
| Enterprise | Individuell | Individuell | Große Organisationen, Compliance-Anforderungen |
Free (Kostenlos)
Der kostenlose Plan bietet eingeschränkten Zugriff auf Claude über die Weboberfläche, ohne Claude Code und ohne API-Zugriff. Geeignet für gelegentliche Nutzung; keine ernsthafte Option für Entwicklung oder tägliche Produktivitätsarbeit.
Pro ($20/Monat)
Pro bietet 5-mal mehr Nutzung als Free und schaltet Zugriff auf alle aktuellen Modellstufen frei – Haiku 4.5, Sonnet 4.6 und Opus 4.7. Claude Code ist enthalten. Der Jahrestarif von ~$17/Monat macht es zum kostengünstigsten Einstiegspunkt für einzelne Entwickler oder jeden, der Claude als primäres Werkzeug nutzt.
Max-Pläne ($100–$200/Monat)
Die Max-Stufen existieren, weil Claude Code und erweiterte agentische Sitzungen die Nutzungskontingente schnell verbrauchen – etwa 5- bis 20-mal schneller als Konversations-Chat. Wenn du bei Programmieraufgaben regelmäßig an die Pro-Grenzen stößt, deckt Max 5x ($100) die 5-fache Nutzung von Pro ab. Max 20x ($200) ist für Entwickler, die den ganzen Tag über mehrstufige Agenten oder lange Codierungssitzungen ausführen.
Team-Pläne ($25–$125/Sitzplatz/Monat)
Team Standard eignet sich für Organisationen, die einen gemeinsamen Arbeitsbereich, Admin-Kontrollen und Standard-Modellzugriff ohne Claude Code-Anforderungen wünschen. Team Premium fügt Claude Code-Zugriff für Technikteams hinzu und ist das praktische Äquivalent eines Max-Plans auf Teamebene. Mindestanzahlen an Sitzplätzen können gelten – überprüfe die aktuelle Anthropic-Preisseite.
Enterprise
Enterprise-Preise sind individuell und beinhalten in der Regel dedizierten Support, erweiterte Sicherheits- und Compliance-Funktionen (SSO, Audit-Logs) sowie ausgehandelte Preisobergrenzen. Die Grundpreise beginnen in der Regel bei etwa $20/Sitzplatz plus API-Nutzung, aber die tatsächlichen Konditionen hängen von der Vertragsgröße und den Anforderungen ab.
Claude-API-Preise nach Modell
Der API-Zugriff erfolgt nutzungsabhängig (Pay-as-you-go), abgerechnet pro Million Token (MTok). Eingabe- und Ausgabetoken werden separat berechnet. Stand Juli 2026 sind die aktiven Modellstufen:
| Modell | Eingabe ($/MTok) | Ausgabe ($/MTok) | Kontextfenster | Maximale Ausgabe |
|---|---|---|---|---|
| Claude Opus 4.7 | $5,00 | $25,00 | 1M Token | 128K Token |
| Claude Sonnet 4.6 | $3,00 | $15,00 | 1M Token | 128K Token |
| Claude Haiku 4.5 | $1,00 | $5,00 | 200K Token | 64K Token |
Ein durchgängiges Muster: Ausgabetoken kosten auf jeder Stufe das 5-fache des Eingabetarifs. Dieses Verhältnis ist wichtig für die Kostenschätzung – ein Workflow, der lange Ausgaben generiert, wird den Großteil seines Token-Budgets für die Ausgabe aufwenden.
Praktische Kostenschätzungen pro Aufruf für eine typische Aufgabe (4.000 Eingabetoken + 500 Ausgabetoken):
- Haiku 4.5: ~$0,0065
- Sonnet 4.6: ~$0,019
- Opus 4.7: ~$0,032
Hochgerechnet auf 100.000 Aufrufe/Monat beträgt der Unterschied zwischen Haiku und Opus etwa $650 vs. $3.200 – bei identischem Aufgabenvolumen.
Claude Code-Abonnementkosten
Claude Code, das terminalbasierte Codierungs-Agent von Anthropic, ist in Pro und höher enthalten – es gibt keine eigenständige kostenlose Stufe dafür. Was zwischen den Plänen variiert, ist die Nutzungstiefe:
- Pro ($20/Monat): Claude Code-Zugriff enthalten, aber komplexe oder längerfristige Aufgaben mit mehreren Dateien können das Nutzungslimit schnell ausschöpfen.
- Max 5x ($100/Monat): 5-fache Nutzung von Pro, geeignet für aktive tägliche Codierungssitzungen.
- Max 20x ($200/Monat): Für Entwickler, die Claude Code den ganzen Arbeitstag über als primären IDE-Assistenten nutzen.
- Team Premium ($125/Sitzplatz/Monat): Claude Code für Teams mit gemeinsamem Arbeitsbereich und Admin-Kontrollen.
Eine Klarstellung: Der Abonnementplan steuert, wie viel du Claude Code über die Oberfläche nutzen kannst. Wenn du deinen eigenen Codierungsagenten auf Basis der Anthropic-API baust, sind diese Kosten separat und werden pro Token abgerechnet.
Wie sich API-Token-Kosten summieren
Die Token-Mathematik wird schnell unübersichtlich, insbesondere bei kontextlastigen Aufgaben.
Der Kontext ist wichtiger als die Länge der Ausgabe. Wenn du 100K Token Kontext pro Aufruf übergibst und nur 2K Token zurückerhältst, gibst du allein für die Eingabe von Opus 4.7 pro Aufruf $0,50 aus. Entwickler, die Werkzeuge für Dokumenten-Q&A, Code-Review oder Zusammenfassung mit langem Kontext erstellen, müssen die Eingabekosten als primäre Variable behandeln, nicht die Ausgabe.
Agentische Schleifen multiplizieren Token. Eine einzige Claude Code-Sitzung, die eine Codebasis liest, Dateien überarbeitet und Überprüfungsschritte ausführt, kann im gesamten Gespräch 50K–200K Token erzeugen. Plane entsprechend.
Die Modellwahl ist der größte Kostenhebel. Bevor du eine Arbeitslast Opus 4.7 zuweist, teste, ob Haiku 4.5 oder Sonnet 4.6 akzeptable Qualität erreicht. Viele Klassifizierungs-, Extraktions- und Zusammenfassungsaufgaben laufen auf Haiku bei 80 % niedrigeren Kosten pro Token einwandfrei.
Batch- und Caching-Rabatte
Anthropic bietet zwei strukturierte Möglichkeiten zur Kostensenkung:
Prompt Caching
Für wiederholten Kontext (System-Prompts, Referenzdokumente, Codebasis-Schnappschüsse) vermeidet Prompt Caching die erneute Berechnung des vollen Eingabepreises für gecachte Token. Die Cache-Lese-Raten sind deutlich niedriger – etwa 90 % Einsparungen beim gecachten Anteil für häufig wiederverwendete Prompts. Cache-Schreibvorgänge haben einen kleinen Aufschlag; die Wirtschaftlichkeit ergibt sich, wenn derselbe Kontextblock in vielen Aufrufen vorkommt.
Batch API
Die Batch-API verarbeitet Anfragen asynchron und liefert Ergebnisse innerhalb von 24 Stunden. Aktueller Rabatt: 50 % auf sowohl Eingabe- als auch Ausgabetoken bei unterstützten Modellen. Dies ist eine direkte Lösung für Evaluierungspipelines, Masseninhaltserstellung, nächtliche Datenverarbeitung und alle Workloads, bei denen keine Echtzeit-Latenz erforderlich ist.
Kombiniert beides: Eine Dokumentenanalyse-Pipeline, die einen großen System-Prompt wiederverwendet und Anfragen in Batches verarbeitet, kann die effektiven Token-Kosten im Vergleich zu synchronen, nicht gecachten Aufrufen um 70–80 % senken.
Den richtigen Plan oder die richtige Modellstufe wählen
Ein paar Entscheidungsregeln, die tatsächlich Bestand haben:
Wenn du Claude einige Male pro Woche für Chat und leichte Codierung nutzt: Pro für $20/Monat ist normalerweise ausreichend. Der Jahrestarif bringt es auf ~$17/Monat.
Wenn Claude Code deine primäre Codierungsumgebung ist: Beginne mit Max 5x ($100/Monat). Wechsle zuerst zu Pro und beobachte, ob du innerhalb einer Woche an Grenzen stößt – wenn ja, upgrade.
Wenn du ein API-basiertes Produkt entwickelst: Zahle nicht für ein Abonnement als Ersatz für API-Kosten. Sie sind getrennt. Kaufe Guthaben, nutze die Batch-API für nicht-echtzeitnahe Aufgaben und wähle das günstigste Modell, das die Qualitätsanforderungen für deine spezifische Aufgabe erfüllt.
Für Teams: Team Standard deckt die meisten Zusammenarbeitsbedürfnisse ab. Team Premium ist nur sinnvoll, wenn Ingenieure Claude Code in voller Nutzungstiefe benötigen – der Jahrestarif von $100/Sitzplatz entspricht in etwa einem individuellen Max 5x-Plan.
Für Unternehmen: Verhandle über das Volumen, nicht über die Stufe. Der angegebene Preis pro Sitzplatz ist ein Ausgangspunkt, keine Obergrenze.
Verwendung der Novita AI LLM-API als Kostenalternative
Für Entwickler, die mit Open-Source-Modellen arbeiten oder kostenintensive Workloads betreiben, bietet Novita AI LLM API einen OpenAI-kompatiblen Endpunkt für Modelle wie Llama, Qwen, DeepSeek und GLM zu wesentlich niedrigeren Token-Kosten. Die Eingabepreise beginnen bei $0,02/Million Token für kleinere Modelle, und leistungsfähige mittelgroße Modelle wie die Qwen3- und DeepSeek V3-Reihe liegen bei unter $0,50/Million Token für die Eingabe.
Dies ist in der Praxis für Claude Code-Nutzer relevant: Mehrere Open-Source-Modelle können über die API-Kompatibilitätsschicht als Claude Code-Backends verwendet werden, was die Token-Kosten pro Sitzung erheblich senkt. Beispielsweise läuft GLM-5 zu $1,00/$3,20 pro Million Token auf Novita AI – ein Bruchteil des Opus 4.7-Tarifs – und wurde speziell für agentische Codierungs-Workflows getestet. Siehe Anleitung zur Verwendung von GLM-5 in Claude Code für eine Einrichtungsanleitung.
Für Teams, die mehrstufige Agenten betreiben, bietet Novita Agent Sandbox verwaltete Ausführungsumgebungen für Browser-Automatisierung, Code-Ausführung und Dateioperationen – die Infrastrukturebene, die API-Aufrufe allein nicht abdecken. Informationen zu Preismodellen für die Agent-Sandbox-Infrastruktur findest du unter KI-Agent-Sandbox-Preismodelle.
Wenn die Budgetoptimierung der Haupttreiber ist, findest du unter Die 10 günstigsten LLM-APIs im Jahr 2026 einen Ranglistenvergleich verschiedener Anbieter.
FAQ
Wie viel kostet Claude pro Monat?
Claude kostet $0 (Free), $20 (Pro), $100 (Max 5x) oder $200 (Max 20x) pro Monat für Einzelpläne. Teampläne beginnen bei $25/Sitzplatz (Standard) oder $125/Sitzplatz (Premium). Enterprise-Preise sind individuell.
Wie hoch sind die API-Preise von Claude?
Stand Juli 2026: Haiku 4.5 für $1/$5 pro Million Token (Eingabe/Ausgabe), Sonnet 4.6 für $3/$15 und Opus 4.7 für $5/$25. Alle Tarife sind nutzungsabhängig ohne monatliches Mindestvolumen.
Wie viel kostet Claude Pro?
$20/Monat bei monatlicher Abrechnung oder etwa $17/Monat bei einem Jahresplan.
Wie hoch sind die Preise für Claude Max?
Max 5x kostet $100/Monat und Max 20x kostet $200/Monat. Beides sind Einzelpläne für intensive Claude-Nutzung inklusive Claude Code. Für die Max-Stufen ist derzeit keine jährliche Abrechnungsoption aufgeführt.
Wie viel kostet Claude Code?
Claude Code ist in Pro ($20/Monat) und höher enthalten. Es gibt keine kostenlose Stufe. Team Premium ($125/Sitzplatz/Monat) ist die empfohlene Stufe für Technikteams, die vollen Claude Code-Zugriff benötigen.
Wie hoch ist der Preis für Anthropic Claude Opus 4 in der API?
Claude Opus 4.7 (die aktuelle Opus 4-Veröffentlichung) kostet $5,00/MTok für die Eingabe und $25,00/MTok für die Ausgabe. Prompt Caching- und Batch-API-Rabatte gelten.
Wie hoch ist der Preis für Claude Sonnet 4?
Claude Sonnet 4.6 kostet $3,00/MTok für die Eingabe und $15,00/MTok für die Ausgabe.
Bietet Anthropic Mengenrabatte?
Ja, über zwei Mechanismen: die Batch-API (50 % Rabatt auf Eingabe und Ausgabe bei asynchroner Verarbeitung) und Prompt Caching (bis zu 90 % Einsparungen bei wiederholten Kontextblöcken). Enterprise-Verträge können auch ausgehandelte Preisobergrenzen enthalten.
Wie hoch sind die Anthropic-API-Kosten im großen Maßstab?
Bei 10 Millionen Aufrufen/Monat mit 4K Eingabe + 500 Ausgabe-Token pro Aufruf: Haiku 4.5 summiert sich auf ~$65.000/Monat vor Rabatten; Sonnet 4.6 ~$195.000; Opus 4.7 ~$320.000. Batch-API-Rabatte halbieren diese bei nicht-echtzeitnahen Workloads etwa.
