Qwen3-235B-A22B-Thinking in Claude Code: Sparen Sie 80% der Kosten

Inhaltsverzeichnis

Bietet Qwen3-235B-A22B-Thinking-2507 echte Reasoning-Leistung?
Warum Qwen3-235B-A22B-Thinking-2507 am besten mit Claude Code funktioniert
So verwenden Sie Qwen3-235B-A22B-Thinking-2507 mit Claude Code
Fazit

Entwickler, die agentische Codierungsassistenten erstellen, stehen vor einer entscheidenden Wahl: $3–15 pro Million Output-Tokens für geschlossene Modelle wie Claude Sonnet 4.5 zu zahlen oder auf offene Reasoning-Modelle umzusteigen, die ähnliche Fähigkeiten zu einem Bruchteil der Kosten versprechen. Qwen3-235B-A22B-Thinking-2507 von Alibaba stellt diesen Kompromiss in Frage, indem es Reasoning-Leistung mit einem dedizierten „Thinking Mode“ liefert – alles für $0,30/$3,00 pro 1 Mio. Input/Output-Tokens über Novita AI.

Diese Anleitung zeigt, wie Sie Qwen3-235B-A22B-Thinking-2507 in Claude Code integrieren, den Anthropic-kompatiblen Terminal-Agenten, der agentische Codierungs-Workflows ermöglicht. Sie werden sehen, wie dieses 235B-MoE-Modell (22B aktive Parameter pro Token) die toolreiche Umgebung von Claude Code nutzt, um komplexe Codierungsaufgaben mit erweiterten Reasoning-Spuren zu automatisieren.

Jetzt Qwen3-235B-A22B-Thinking-2507 ausprobieren!

Bietet Qwen3-235B-A22B-Thinking-2507 echte Reasoning-Leistung?

Das Qwen3-235B-A22B-Thinking-2507 ist das neueste denkfähige Modell in der Qwen3-Reihe und bietet große Fortschritte in der Reasoning-Fähigkeit. Es zeichnet sich durch logisches Problemlösen, Mathematik, wissenschaftliche Analysen, Codierung und akademische Bewertungen aus – erreicht oder übertrifft menschliches Expertniveau und liefert wettbewerbsfähige Leistung unter Open-Source-Reasoning-Modellen. Zusätzlich zu seinen Reasoning-Stärken bietet es verbesserte allgemeine Fähigkeiten, darunter genauere Befehlsbefolgung, erweiterte Tool-Integration, hochgradig natürliche Textgenerierung und bessere Ausrichtung auf menschliche Absichten. Das Modell unterstützt zudem einen erweiterten Kontext von 131K Token, was eine kohärente und tiefgehende Verarbeitung langer Dokumente und komplexer Diskussionen ermöglicht.

Architektur und Fähigkeiten

Technischer Parameter	Spezifikation	Beschreibung
Modelltyp	Kausales Sprachmodell	Basierend auf Transformer-Architektur
Gesamtparameter	235B	22B aktivierte Parameter
Nicht-Einbettungsparameter	234B	Tatsächliche Berechnungsparameter
Anzahl der Schichten	94 Schichten	Tiefe neuronale Netzstruktur
Aufmerksamkeitsköpfe	Q: 64, KV: 4	Nutzt GQA-Mechanismus
Anzahl der Experten	128	MoE-Architekturdesign
Aktivierte Experten	8	Dynamische Expertenauswahl
Kontextlänge	262.144 Token	Native Unterstützung für langen Kontext

Benchmark-Leistung (Reasoning-Aufgaben)

Von Hugging Face

Qwen3-235B-A22B-Thinking-2507 zeichnet sich bei reasoning-intensiven und wissensintensiven Aufgaben aus, insbesondere bei Mathematik, mehrsprachigem Wissen und Dokumenten-/Video-Verständnis. Seine Leistung ist durchgängig wettbewerbsfähig mit größeren Modellen in komplexen kognitiven und Verständnis-Benchmarks.

Kosten- und Token-Effizienz

Bei $0,30 pro 1 Mio. Input-Tokens und $3,00 pro 1 Mio. Output-Tokens bietet Qwen3-235B-A22B-Thinking-2507 90% Kosteneinsparung beim Input und 80% Einsparung beim Output im Vergleich zu Claude Sonnet 4.5 ($3/$15 pro 1 Mio. Tokens). Für erweiterte Reasoning-Aufgaben kann das Modell bis zu 81K Tokens ausgeben – was bedeutet, dass eine einzelne komplexe Aufgabe $0,24 an Output-Tokens kosten könnte, verglichen mit $1,22 bei Claude.

Jetzt Qwen3-235B-A22B-Thinking-2507 ausprobieren!

Warum Qwen3-235B-A22B-Thinking-2507 am besten mit Claude Code funktioniert

Claude Code ist eine terminalbasierte agentische Codierungsschnittstelle von Anthropic. Sie orchestriert mehrstufige Workflows durch den Aufruf von Tools (Dateibearbeitung, Bash-Befehle, Suche), verwaltet Kontext über Aufgaben hinweg und iteriert basierend auf Feedback. Die expliziten Reasoning-Spuren von Qwen3-235B-A22B-Thinking-2507 passen perfekt zu diesem agentischen Paradigma – das Modell zeigt seine Planungsschritte, bevor es Tool-Aufrufe ausführt, wodurch komplexe Workflows debugbar und transparent werden.

1. Optimiert für agentische Interaktionen

Qwen3-235B-A22B-Thinking-2507 ist darauf ausgelegt, Aktionen durchzuführen, Tools zu verwenden und mehrstufige Aufgaben zu verwalten. Sein Thinking Mode gibt strukturierte Reasoning-Ketten aus, die mit der Erwartung von Claude Code an Plan → Ausführen → Überprüfen-Workflows übereinstimmen. Wenn das Modell eine Umstrukturierung über 5 Dateien plant, sehen Sie das schrittweise Reasoning, bevor Dateibearbeitungen erfolgen.

2. Reichhaltige Toolchains und API-Unterstützung

Claude Code bietet vorkonfigurierten Zugriff auf Dateisystemoperationen, Bash-Ausführung, grep/Suche, Git-Befehle und externe Tool-Integrationen. Qwen3-Modelle unterstützen Tool-Calling-Schemata, JSON-Modus und Funktionsdefinitionen – was eine nahtlose Nutzung der Tool-Suite von Claude Code für Aufgaben wie automatisierte Tests, Bereitstellungsskripte und dateiübergreifende Umstrukturierungen ermöglicht.

3. Echtzeit-Feedback-Schleifen

Der Thinking Mode des Modells ermöglicht adaptives Debugging: Wenn ein Tool-Aufruf fehlschlägt (z. B. Testfehler), zeigt die Reasoning-Spur, was das Modell angenommen hat, sodass Sie falsche Annahmen während der Sitzung korrigieren können. Dies ist entscheidend für agentische Workflows, bei denen frühe Fehler über 20+ Schritte hinweg kaskadieren.

4. Erweiterte Ausgabe für komplexes Reasoning

Claude Code-Aufgaben wie „Authentifizierungsablauf über 8 Dateien umstrukturieren“ oder „Speicherleck mit Profiler-Integration debuggen“ erfordern mehrstufige Pläne mit 10K+ Token-Ausgaben. Qwen3-235B-A22B-Thinking-2507 unterstützt bis zu 81K Tokens für komplexes Reasoning – weit über die üblichen Modellgrenzen hinaus – und hält die Kosten dabei niedrig ($0,24 pro 81K Output vs. $1,22 für Claude).

So verwenden Sie Qwen3-235B-A22B-Thinking-2507 mit Claude Code

Novita AI bietet einen Anthropic-kompatiblen API-Endpunkt, sodass Claude Code über einfache Umgebungsvariablenkonfiguration mit Qwen3-235B-A22B-Thinking-2507 arbeitet – keine Codeänderungen erforderlich. Das 256K-Kontextfenster des Modells und die Preisgestaltung von $0,30/$3,00 pro 1 Mio. Input/Output-Tokens machen es ideal für erweiterte Codierungssitzungen.

Voraussetzungen – Novita AI API-Key erhalten

Schritt 1: Erstellen Sie ein kostenloses Konto bei Novita AI und melden Sie sich an.

Schritt 2: Navigieren Sie zur Modellbibliothek und suchen Sie nach qwen/qwen3-235b-a22b-thinking-2507.

Schritt 3: Klicken Sie auf Kostenlose Testversion starten, um den Zugriff zu aktivieren (Novita bietet Testguthaben für neue Benutzer).

Schritt 4: Gehen Sie zu Einstellungen → API-Schlüssel und klicken Sie auf API-Schlüssel generieren. Kopieren Sie den Schlüssel.

Schritt 5: Überprüfen Sie die API-Verbindung mit diesem Python-Test:

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="qwen/qwen3-235b-a22b-thinking-2507",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=32768,
    temperature=0.7
)

print(response.choices[0].message.content)

Sie sollten die Antwort des Modells sehen, wobei Reasoning-Spuren in thinking-Tags eingeschlossen sind.

Jetzt Qwen3-235B-A22B-Thinking-2507 ausprobieren!

Claude Code Einrichtungsanleitung

Schritt 1: Claude Code installieren

#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash

#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex

#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd

Windows benötigt Git für Windows. Installieren Sie es zuerst, falls nicht vorhanden.

Schritt 2: Umgebungsvariablen einrichten

Claude Code verwendet 4 Umgebungsvariablen, um API-Anfragen an Novita AI weiterzuleiten:

#Für macOS/Linux (Bash/Zsh):
# Setzen Sie den Anthropic-SDK-kompatiblen API-Endpunkt von Novita.
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# Setzen Sie das von Novita bereitgestellte Modell.
export ANTHROPIC_MODEL="qwen/qwen3-235b-a22b-thinking-2507"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3-235b-a22b-thinking-2507"

#Für Windows (PowerShell):
$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "Novita API Key"
$env:ANTHROPIC_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"
$env:ANTHROPIC_SMALL_FAST_MODEL = "qwen/qwen3-235b-a22b-thinking-2507"

Erklärung:

ANTHROPIC_BASE_URL: Verweist Claude Code auf Novitas Anthropic-kompatiblen Endpunkt
ANTHROPIC_AUTH_TOKEN: Ihr Novita-API-Key (kein Anthropic-Key)
ANTHROPIC_MODEL: Primäres Modell für komplexe Aufgaben (Thinking Mode)
ANTHROPIC_SMALL_FAST_MODEL: Fallback-Modell für schnelle Operationen (auf dasselbe Modell setzen, wenn konsistentes Reasoning-Verhalten gewünscht ist)

Schritt 3: Claude Code starten

Navigieren Sie zu Ihrem Projektverzeichnis und starten Sie Claude Code:

cd <your-project-directory>
claude .

Sie sehen die Claude Code-Eingabeaufforderung in einer interaktiven Sitzung. Der Thinking Mode des Modells wird bei komplexen Abfragen automatisch aktiviert.

Beispielaufgabe:

> Refactoren Sie das Authentifizierungsmodul, sodass JWT-Tokens anstelle von Sessions verwendet werden. Aktualisieren Sie alle 5 zugehörigen Dateien und fügen Sie Unit-Tests hinzu.

Claude Code analysiert die Anfrage, ruft Qwen3-235B-A22B-Thinking-2507 auf, um einen mehrstufigen Plan zu generieren (sichtbar in thinking-Blöcken), und führt dann Dateibearbeitungen durch, schreibt Tests und überprüft die Änderungen.

Prof-Tipp: Erhöhen Sie für mathematisch intensive oder algorithmische Designaufgaben max_tokens in Ihren API-Aufrufen auf 131072, um die erweiterte Reasoning-Kapazität von Qwen3-235B-A22B-Thinking-2507 zu nutzen. Legen Sie dies über die Konfiguration von Claude Code fest, sofern Token-Grenzen verfügbar sind.

Jetzt Qwen3-235B-A22B-Thinking-2507 ausprobieren!

Qwen3-235B-A22B-Thinking-2507 bietet erweitertes Reasoning, Langkontext-Handhabung und strukturierte mehrstufige Planung zu einem Bruchteil der Kosten geschlossener Modelle. In Kombination mit Claude Code ermöglicht es transparente, debugbare agentische Codierungs-Workflows und ist somit eine praktische Lösung für Entwickler, die leistungsstarkes Reasoning und Codierungsautomatisierung ohne hohe Token-Kosten suchen.

Fazit

Qwen3-235B-A22B-Thinking-2507 liefert erweitertes Reasoning, transparenten Chain-of-Thought-Output und starke Tool-Nutzungsfähigkeiten für den agentischen Workflow von Claude Code – zu einem Bruchteil der Kosten geschlossener Modelle. Für Entwickler, die komplexe Codierungsaufgaben ausführen, bietet die Kombination sowohl Leistung als auch Budgeteffizienz.

Wichtigste Erkenntnis: Richten Sie vier Umgebungsvariablen ein, verweisen Sie Claude Code auf Novita AIs Anthropic-kompatiblen Endpunkt, und Sie sind in wenigen Minuten betriebsbereit für erweiterte Reasoning-Workflows. Probieren Sie Qwen3-235B-A22B-Thinking-2507 auf Novita AI aus und starten Sie noch heute.

Was unterscheidet Qwen3-235B-A22B-Thinking-2507 von standardmäßigen Codierungsmodellen?

Es ist ein reines Thinking-Modell, das strukturierte Reasoning-Spuren in thinking-Blöcken ausgibt, bevor Code generiert wird, wodurch komplexe agentische Workflows transparent und debugbar werden. Im Gegensatz zu allgemeinen Instruktionsmodellen ist es ausschließlich für reasoning-intensive Aufgaben wie Wettbewerbsprogrammierung, Algorithmendesign und mehrstufiges Debugging optimiert.

Kann ich Qwen3-235B-A22B-Thinking-2507 auch in anderen Tools als Claude Code verwenden?

Ja – es funktioniert mit jedem Tool, das OpenAI-kompatible APIs unterstützt. Trae (GUI-IDE), OpenCode (Terminal-Agent), Cursor (Code-Editor) und benutzerdefinierte Python/Node.js-Skripte unterstützen es alle über den Endpunkt https://api.novita.ai/v3/openai von Novita AI.

Benötige ich eine GPU, um Qwen3-235B-A22B-Thinking-2507 lokal auszuführen?

Ja – geschätzt 4×H100 80GB für FP8. Für die meisten Entwickler ist die API von Novita AI kosteneffizienter als Selbsthosting, es sei denn, Sie führen 10.000+ Aufgaben pro Monat aus.

Empfohlene Lektüre

Novita AI ist eine KI- & Agenten-Cloud-Plattform, die Entwicklern und Startups hilft, Modelle und agentische Anwendungen mit hoher Leistung, Zuverlässigkeit und Kosteneffizienz zu erstellen, bereitzustellen und zu skalieren.

Qwen3-235B-A22B-Thinking in Claude Code: Sparen Sie 80% der Kosten

Bietet Qwen3-235B-A22B-Thinking-2507 echte Reasoning-Leistung?

Architektur und Fähigkeiten

Benchmark-Leistung (Reasoning-Aufgaben)

Kosten- und Token-Effizienz

Warum Qwen3-235B-A22B-Thinking-2507 am besten mit Claude Code funktioniert

1. Optimiert für agentische Interaktionen

2. Reichhaltige Toolchains und API-Unterstützung

3. Echtzeit-Feedback-Schleifen

4. Erweiterte Ausgabe für komplexes Reasoning

So verwenden Sie Qwen3-235B-A22B-Thinking-2507 mit Claude Code

Voraussetzungen – Novita AI API-Key erhalten

Claude Code Einrichtungsanleitung

Schritt 1: Claude Code installieren

Schritt 2: Umgebungsvariablen einrichten

Schritt 3: Claude Code starten

Fazit

Product

RESOURCES

Partners

Company

Bietet Qwen3-235B-A22B-Thinking-2507 echte Reasoning-Leistung?

Architektur und Fähigkeiten

Benchmark-Leistung (Reasoning-Aufgaben)

Kosten- und Token-Effizienz

Warum Qwen3-235B-A22B-Thinking-2507 am besten mit Claude Code funktioniert

1. Optimiert für agentische Interaktionen

2. Reichhaltige Toolchains und API-Unterstützung

3. Echtzeit-Feedback-Schleifen

4. Erweiterte Ausgabe für komplexes Reasoning

So verwenden Sie Qwen3-235B-A22B-Thinking-2507 mit Claude Code

Voraussetzungen – Novita AI API-Key erhalten

Claude Code Einrichtungsanleitung

Schritt 1: Claude Code installieren

Schritt 2: Umgebungsvariablen einrichten

Schritt 3: Claude Code starten

Fazit

Ähnliche Beiträge

Product

RESOURCES

Partners

Company