Entwickler, die agentische Coding-Assistenten erstellen, stehen vor einer entscheidenden Wahl: zahlen Sie 3–15 US-Dollar pro Million Ausgabetoken für geschlossene Modelle wie Claude Sonnet 4.5, oder wechseln Sie zu offenen Reasoning-Modellen, die ähnliche Fähigkeiten zu einem Bruchteil der Kosten versprechen. Qwen3-235B-A22B-Thinking-2507 von Alibaba stellt diesen Kompromiss in Frage, indem es Reasoning-Leistung mit einem dedizierten „Thinking-Modus“ liefert – alles zu 0,30/3,00 US-Dollar pro 1M Ein-/Ausgabetoken über Novita AI.
Diese Anleitung zeigt Ihnen, wie Sie Qwen3-235B-A22B-Thinking-2507 in Claude Code integrieren, den Anthropic-kompatiblen Terminal-Agenten, der agentische Coding-Workflows ermöglicht. Sie erfahren, wie dieses 235B-MoE-Modell (22B aktive Parameter pro Token) die toolreiche Umgebung von Claude Code nutzt, um komplexe Coding-Aufgaben mit erweiterten Reasoning-Spuren zu automatisieren.
Probieren Sie Qwen3-235B-A22B-Thinking-2507 jetzt aus!
Liefert Qwen3-235B-A22B-Thinking-2507 echte Reasoning-Leistung?
Das Qwen3-235B-A22B-Thinking-2507 ist das neueste denkfähige Modell der Qwen3-Reihe und bietet große Fortschritte im Bereich der Reasoning-Fähigkeiten. Es zeichnet sich durch logische Problemlösung, Mathematik, wissenschaftliche Analyse, Coding und akademische Bewertungen aus – es erreicht oder übertrifft die Leistung von menschlichen Experten und liefert eine wettbewerbsfähige Leistung unter den Open-Source-Reasoning-Modellen. Zusätzlich zu seinen Reasoning-Stärken bietet es verbesserte allgemeine Fähigkeiten, darunter genauere Befolgung von Anweisungen, fortschrittliche Tool-Integration, hochgradig natürliche Textgenerierung und eine bessere Ausrichtung auf menschliche Absichten. Das Modell unterstützt zudem einen erweiterten 131K-Token-Kontext, sodass lange Dokumente und komplexe Diskussionen kohärent und tiefgehend verarbeitet werden können.
Architektur und Fähigkeiten
| Technischer Parameter | Spezifikation | Beschreibung |
|---|---|---|
| Modelltyp | Kausales Sprachmodell | Basierend auf Transformer-Architektur |
| Gesamtparameter | 235B | 22B aktivierte Parameter |
| Nicht-Einbettungsparameter | 234B | Tatsächliche Berechnungsparameter |
| Anzahl Schichten | 94 Schichten | Tiefe neuronale Netzwerkstruktur |
| Aufmerksamkeitsköpfe | Q: 64, KV: 4 | Verwendet GQA-Mechanismus |
| Anzahl Experten | 128 | MoE-Architekturdesign |
| Aktivierte Experten | 8 | Dynamische Expertenauswahl |
| Kontextlänge | 262.144 Token | Native Langkontextunterstützung |
Benchmark-Leistung (Reasoning-Aufgaben)

Von Hugging Face
Qwen3-235B-A22B-Thinking-2507 zeichnet sich durch reasoning-intensive und wissensintensive Aufgaben aus, insbesondere Mathematik, mehrsprachiges Wissen sowie Dokumenten-/Video-Verständnis. Seine Leistung ist durchgehend wettbewerbsfähig mit größeren Modellen bei komplexen kognitiven und Verständnis-Benchmarks.
Kosten- und Token-Effizienz
Zu 0,30 US-Dollar pro 1M Eingabetoken und 3,00 US-Dollar pro 1M Ausgabetoken bietet Qwen3-235B-A22B-Thinking-2507 90 % Kosteneinsparungen bei Eingaben und 80 % Einsparungen bei Ausgaben im Vergleich zu Claude Sonnet 4.5 (3/15 US-Dollar pro 1M Token). Bei erweiterten Reasoning-Aufgaben kann das Modell bis zu 81K Token ausgeben – das bedeutet, dass eine einzelne komplexe Aufgabe nur 0,24 US-Dollar an Ausgabetoken kosten könnte, verglichen mit 1,22 US-Dollar bei Claude.

Probieren Sie Qwen3-235B-A22B-Thinking-2507 jetzt aus!
Warum Qwen3-235B-A22B-Thinking-2507 am besten mit Claude Code funktioniert
Claude Code ist ein terminalbasiertes agentisches Coding-Interface von Anthropic. Es orchestriert mehrstufige Workflows, indem es Tools (Dateibearbeitung, Bash-Befehle, Suche) aufruft, Kontexte über Aufgaben hinweg verwaltet und basierend auf Feedback iteriert. Die expliziten Reasoning-Spuren von Qwen3-235B-A22B-Thinking-2507 passen perfekt zu diesem agentischen Paradigma – das Modell zeigt seine Planungsschritte, bevor es Tool-Aufrufe ausführt, was komplexe Workflows debuggbar und transparent macht.
1. Optimiert für agentische Interaktionen
Qwen3-235B-A22B-Thinking-2507 wurde entwickelt, um Aktionen auszuführen, Tools zu nutzen und mehrstufige Aufgaben zu verwalten. Sein Thinking-Modus gibt strukturierte Reasoning-Ketten aus, die den Erwartungen von Claude Code an Plan → Ausführen → Verifizieren-Workflows entsprechen. Wenn das Modell eine Refaktorierung über 5 Dateien hinweg plant, sehen Sie die schrittweise Reasoning, bevor irgendwelche Dateibearbeitungen erfolgen.
2. Umfangreiche Toolchains und API-Unterstützung
Claude Code bietet vorkonfigurierten Zugriff auf Dateisystemoperationen, Bash-Ausführung, grep/Suche, Git-Befehle und externe Tool-Integrationen. Qwen3-Modelle unterstützen Tool-Calling-Schemas, JSON-Modus und Funktionsdefinitionen – dies ermöglicht die nahtlose Aufrufung der Tool-Suite von Claude Code für Aufgaben wie automatisiertes Testen, Deployment-Skripte und mehrdateiige Refaktorierung.
3. Echtzeit-Feedback-Schleifen
Der Thinking-Modus des Modells ermöglicht adaptives Debugging: Wenn ein Tool-Aufruf fehlschlägt (z. B. Fehler in der Testsuite), zeigt die Reasoning-Spur, welche Annahmen das Modell getroffen hat, sodass Sie Fehlvorstellungen mitten in der Sitzung korrigieren können. Dies ist entscheidend für agentische Workflows, bei denen frühe Fehler sich über 20+ Schritte ausbreiten.
4. Erweiterte Ausgabe für komplexe Reasoning
Claude Code-Aufgaben wie „Refaktorierung des Authentifizierungsablaufs über 8 Dateien hinweg“ oder „Debuggen von Speicherlecks mit Profiler-Integration“ erfordern mehrstufige Pläne mit 10K+ Token-Ausgabe. Qwen3-235B-A22B-Thinking-2507 unterstützt bis zu 81K Token für komplexe Reasoning – weit über die Grenzen von Standardmodellen hinaus – und hält die Kosten dabei überschaubar (0,24 US-Dollar pro 81K Ausgabe im Vergleich zu 1,22 US-Dollar bei Claude).
So verwenden Sie Qwen3-235B-A22B-Thinking-2507 mit Claude Code
Novita AI bietet einen Anthropic-kompatiblen API-Endpunkt, sodass Claude Code mit Qwen3-235B-A22B-Thinking-2507 über eine einfache Umgebungsvariablen-Konfiguration funktioniert – keine Code-Änderungen erforderlich. Das 256K-Kontextfenster des Modells und die Preisgestaltung von 0,30/3,00 US-Dollar pro 1M Ein-/Ausgabetoken machen es ideal für längere Coding-Sitzungen.
Voraussetzungen – Holen Sie sich Ihren Novita AI API-Schlüssel
Schritt 1: Erstellen Sie ein kostenloses Konto bei Novita AI und melden Sie sich an.
Schritt 2: Navigieren Sie zur Modellbibliothek und suchen Sie nach qwen/qwen3-235b-a22b-thinking-2507.
Schritt 3: Klicken Sie auf Kostenlose Testversion starten, um den Zugriff zu aktivieren (Novita stellt Testguthaben für neue Nutzer bereit).
Schritt 4: Gehen Sie zu Einstellungen → API-Schlüssel und klicken Sie auf API-Schlüssel generieren. Kopieren Sie den Schlüssel.
Schritt 5: Überprüfen Sie die API-Verbindung mit diesem Python-Test:
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="qwen/qwen3-235b-a22b-thinking-2507",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=32768,
temperature=0.7
)
print(response.choices[0].message.content)
Sie sollten die Antwort des Modells sehen, wobei Reasoning-Spuren in <think>-Tags eingeschlossen sind.
Probieren Sie Qwen3-235B-A22B-Thinking-2507 jetzt aus!
Anleitung zur Einrichtung von Claude Code
Schritt 1: Installation von Claude Code
#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash
#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex
#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
Windows erfordert Git für Windows. Installieren Sie es zuerst, falls Sie es noch nicht haben.
Schritt 2: Einrichtung von Umgebungsvariablen
Claude Code verwendet 4 Umgebungsvariablen, um API-Anfragen an Novita AI weiterzuleiten:
#Für macOS/Linux (Bash/Zsh):
# Set the Anthropic SDK compatible API endpoint provided by Novita.
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# Set the model provided by Novita.
export ANTHROPIC_MODEL="qwen/qwen3-235b-a22b-thinking-2507"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3-235b-a22b-thinking-2507"
#Für Windows (PowerShell):
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Novita API Key"
$env:ANTHROPIC_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"
$env:ANTHROPIC_SMALL_FAST_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"
Erklärung:
ANTHROPIC_BASE_URL: Verweist Claude Code auf den Anthropic-kompatiblen Endpunkt von NovitaANTHROPIC_AUTH_TOKEN: Ihr Novita API-Schlüssel (kein Anthropic-Schlüssel)ANTHROPIC_MODEL: Primärmodell für komplexe Aufgaben (Thinking-Modus)ANTHROPIC_SMALL_FAST_MODEL: Fallback-Modell für schnelle Operationen (setzen Sie es auf das gleiche Modell, wenn Sie konsistentes Reasoning-Verhalten wünschen)
Schritt 3: Starten von Claude Code
Navigieren Sie zu Ihrem Projektverzeichnis und starten Sie Claude Code:
cd <your-project-directory>
claude .
Sie sehen den Claude Code-Prompt in einer interaktiven Sitzung. Der Thinking-Modus des Modells wird automatisch bei komplexen Anfragen aktiviert.
Beispielaufgabe:
> Refactor the authentication module to use JWT tokens instead of sessions. Update all 5 related files and add unit tests.
Claude Code analysiert die Anfrage, ruft Qwen3-235B-A22B-Thinking-2507 auf, um einen mehrstufigen Plan zu generieren (sichtbar in <think>-Blöcken), führt dann Dateibearbeitungen durch, schreibt Tests und überprüft die Änderungen.
Pro-Tipp: Für rechenintensive oder Algorithmus-Design-Aufgaben erhöhen Sie
max_tokensin Ihren API-Aufrufen auf 131072, um die erweiterte Reasoning-Kapazität von Qwen3-235B-A22B-Thinking-2507 zu nutzen. Setzen Sie dies über die Konfiguration von Claude Code, falls es Token-Grenzen offenlegt.
Probieren Sie Qwen3-235B-A22B-Thinking-2507 jetzt aus!
Qwen3-235B-A22B-Thinking-2507 liefert fortschrittliche Reasoning, Langkontextverarbeitung und strukturierte mehrstufige Planung zu einem Bruchteil der Kosten von geschlossenen Modellen. In Kombination mit Claude Code ermöglicht es transparente, debugbare agentische Coding-Workflows und ist damit eine praktische Lösung für Entwickler, die nach leistungsstarker Reasoning und Coding-Automatisierung ohne unverhältnäßige Token-Kosten suchen.
Fazit
Qwen3-235B-A22B-Thinking-2507 bringt erweiterte Reasoning, transparente Chain-of-Thought-Ausgabe und starke Tool-Nutzungsfähigkeiten in den agentischen Workflow von Claude Code – zu einem Bruchteil der Kosten von geschlossenen Modellen. Für Entwickler, die komplexe Coding-Aufgaben ausführen, bietet die Kombination sowohl Leistung als auch Budget-Effizienz.
Wichtigste Erkenntnis: Richten Sie vier Umgebungsvariablen ein, verweisen Sie Claude Code auf den Anthropic-kompatiblen Endpunkt von Novita AI, und Sie führen innerhalb von Minuten fortschrittliche Reasoning-Workflows aus. Probieren Sie Qwen3-235B-A22B-Thinking-2507 auf Novita AI aus und fangen Sie noch heute an zu entwickeln.
Was unterscheidet Qwen3-235B-A22B-Thinking-2507 von Standard-Coding-Modellen?
Es ist ein reines Denkmodell, das strukturierte Reasoning-Spuren in <think>-Blöcken ausgibt, bevor es Code generiert, was komplexe agentische Workflows transparent und debugbar macht. Im Gegensatz zu allgemeinen Anweisungsmodellen ist es ausschließlich für reasoning-intensive Aufgaben wie Wettbewerbsprogrammierung, Algorithmus-Design und mehrstufiges Debugging optimiert.
Kann ich Qwen3-235B-A22B-Thinking-2507 in anderen Tools als Claude Code verwenden?
Ja – es funktioniert mit jedem Tool, das OpenAI-kompatible APIs unterstützt. Trae (GUI-IDE), OpenCode (Terminal-Agent), Cursor (Code-Editor) und benutzerdefinierte Python/Node.js-Skripte unterstützen es alle über den Endpunkt https://api.novita.ai/v3/openai von Novita AI.
Benötige ich eine GPU, um Qwen3-235B-A22B-Thinking-2507 lokal auszuführen?
Ja – geschätzte 4×H100 80GB für FP8. Für die meisten Entwickler ist die API von Novita AI kosteneffizienter als Self-Hosting, es sei denn, Sie führen 10.000+ Aufgaben pro Monat aus.
Empfohlene Lektüre
- Verwenden Sie GLM-4.5 in Trae, um intelligentere Coding-Agenten freizuschalten
- Verwenden Sie Codex CLI mit Novita AI
- Verwenden Sie MiniMax M2.1 in OpenCode
Novita AI ist eine KI- & Agenten-Cloud-Plattform, die Entwicklern und Startups hilft, Modelle und agentische Anwendungen mit hoher Leistung, Zuverlässigkeit und Kosteneffizienz zu erstellen, bereitzustellen und zu skalieren.
