Entwickler, die große Codebasen oder Multi-Dokument-Workflows verwalten, stehen bei der Verwendung herkömmlicher Transformer-Modelle vor anhaltenden Herausforderungen wie hohen Rechenkosten, instabiler Langkontext-Leistung und inkonsistentem Codeverständnis. Diese Einschränkungen begrenzen die Iterationseffizienz, schränken die Analyse auf Repository-Ebene ein und erhöhen die Betriebskosten. Die Einführung von DeepSeek V3.2 löst diese Probleme durch die Integration von DeepSeek Sparse Attention (DSA), einem Mechanismus, der darauf ausgelegt ist, den Attention-Overhead zu reduzieren, die Kontexterschließung zu beschleunigen und die Codegenerierung zu stabilisieren.
Dieser Artikel untersucht, wie DeepSeek V3.2 die Kosteneffizienz, die Langkontext-Verarbeitung und die codeorientierten Funktionen verbessert. Er enthält operative Anleitungen zur Bereitstellung von DeepSeek V3.2 über Novita AI und Claude Code.
Achtung! Novita AI startet seine „Build Month“-Kampagne und bietet Entwicklern einen exklusiven Rabatt von bis zu 20 % auf alle Hauptprodukte!
Welche neuen Code-Funktionen bietet DeepSeek V3.2?
DSA ist ein revolutionärer Attention-Mechanismus, der die Art und Weise, wie das Modell Informationen verarbeitet, grundlegend verändert. Während herkömmliche Transformer erfordern, dass jedes Token auf alle anderen Token achtet – was zu quadratischen Rechenkosten (O(n²)) führt – führt DSA einen feingranularen, inhaltsbewussten Auswahlmechanismus ein:
- Intelligente Filterung: Während des Trainings lernt das Modell, welche Token-Beziehungen für bestimmte Aufgaben wirklich wichtig sind
- Dynamische Verbindungen: Echtzeitauswahl der erforderlichen Attention-Verbindungen basierend auf dem Eingabeinhalt.
- Aufgabenoptimierung: Konzentriert sich auf unterschiedliche strukturelle Muster bei der Verarbeitung von Code im Vergleich zu Rechtsdokumenten
Drei von DSA ermöglichte Kernverbesserungen
Direkte Selbstanpassung wird als Hilfsmechanismus eingesetzt, um die Gesamtleistung des Modells zu verbessern, ohne die Kernarchitektur zu verändern. Mit diesem Ansatz erreicht das Modell eine signifikante Kosteneffizienz, indem es eine wirtschaftlichere Inferenz ermöglicht, während es die Codegenerierungs- und Analysequalität auf dem Niveau von v3.1 beibehält, was häufige Tests und schnelle Iterationen unterstützt.
DSA stärkt zudem die Langkontext-Nutzung, indem es effektiv ein Kontextfenster von bis zu 128K Tokens nutzt, was die gleichzeitige Multi-Datei-Analyse, das Verständnis von dateiübergreifenden Abhängigkeiten und die Verarbeitung komplexer technischer Dokumentation verbessert.
Darüber hinaus trägt DSA zu verbesserten codebezogenen Funktionen bei, einschließlich schnellerer Inferenzantworten, genauerem Codeverständnis und stabilerer Codegenerierungsqualität, was gemeinsam die Zuverlässigkeit und Effizienz des Modells in groß angelegten Softwareentwicklungsszenarien verbessert.
Skalierbares Verstärkungslern-Framework
Durch die Einführung eines robusten Verstärkungslern-Protokolls und die Skalierung der Nach-Trainings-Berechnung erreicht DeepSeek-V3.2 eine mit GPT-5 vergleichbare Leistung. Insbesondere die Hochrechen-Variante DeepSeek-V3.2-Speciale übertrifft GPT-5 konsistent und zeigt Reasoning-Fähigkeiten auf dem Niveau von Gemini-3.0-Pro.
| Benchmark | Metrik | DeepSeek-V3.2-Speciale | DeepSeek-V3.2-Thinking | GPT-5-High | Claude-4.5-Sonnet | Gemini-3.0-Pro |
|---|---|---|---|---|---|---|
| AIME 2025 | Pass@1 (%) | 96.0 | 93.1 | 94.6 | 87.0 | 95.0 |
| HMMT 2025 | Pass@1 (%) | 99.2 | 90.2 | 88.3 | 79.2 | 97.5 |
| HLE | Pass@1 (%) | 30.6 | 25.1 | 26.3 | 13.7 | 37.7 |
| Codeforces | Rating | 2701 | 2386 | 2537 | 1480 | 2708 |
| SWE Verified | Gelöst (%) | – | 73.1 | 74.9 | 77.2 | 76.2 |
| Terminal Bench 2.0 | Genauigkeit (%) | – | 46.4 | 35.2 | 42.8 | 54.2 |
| τ² Bench | Pass@1 (%) | – | 80.3 | 80.2 | 84.7 | 85.4 |
| Tool Decathlon | Pass@1 (%) | – | 35.2 | 29.0 | 38.6 | 36.4 |
Probieren Sie DeepSeek V3.2 mit 20 % Rabatt aus!
DeepSeek V3.2: Was wurde getan, um die Zusammenarbeit mit Entwicklern zu verbessern?
Um Reasoning besser in Szenarien mit Tool-Nutzung zu integrieren, hat DeepSeek während der Nach-Trainings-Phase von V3.2 eine Large-Scale Agentic Task Synthesis Pipeline eingeführt. Die Kernidee ist, agentische Trainingsdaten systematisch im großen Maßstab zu generieren, anstatt sich auf handgefertigte Prompts oder begrenzte menschliche Demonstrationen zu verlassen.
Diese Pipeline konstruiert Aufgaben programmatisch, die das Modell dazu bringen, Schlussfolgerungen zu ziehen, Entscheidungen zu treffen, Tools aufzurufen, Zwischenergebnisse zu beobachten und sein Verhalten entsprechend anzupassen. Indem das Modell einer Vielzahl strukturierter Interaktionen ausgesetzt wird, ermöglicht DeepSeek ein skalierbares agentisches Nach-Training, das die Verhaltenskonformität und Generalisierung in komplexen, mehrstufigen interaktiven Umgebungen wie Suche, Codierung und tool-erweiterten Workflows deutlich verbessert.
Die beiden wichtigsten Updates sind:
Ein überarbeitetes Tool-Aufruf-Format, das expliziter und stabiler in mehrstufigen Interaktionen sein soll
Native Unterstützung für „Denken mit Tools“, bei der Reasoning und Tool-Nutzung strukturell integriert sind, anstatt nur locker miteinander verwoben zu sein
Um der Community zu helfen, diese neue Vorlage zu verstehen und zu übernehmen, stellt DeepSeek einen dedizierten encoding-Ordner zur Verfügung. Dieser Ordner enthält Python-Skripte und Testfälle, die demonstrieren: wie man OpenAI-kompatible Nachrichten in einen einzelnen Eingabe-String kodiert, der von DeepSeek-V3.2 erwartet wird, und wie man die Textausgabe des Modells wieder in strukturierte Nachrichten parst.
import transformers
# encoding/encoding_dsv32.py
from encoding_dsv32 import encode_messages, parse_message_from_completion_text
tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")
messages = [
{"role": "user", "content": "hello"},
{"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
{"role": "user", "content": "1+1=?"}
]
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)
prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)
Es ist zu beachten, dass diese Version kein auf Jinja basierendes Chat-Template enthält. Die bereitgestellte Python-Implementierung ist die maßgebliche Referenz. Darüber hinaus geht die Ausgabeparsing-Funktion von wohlgeformten Modellausgaben aus und ist nur für Demonstrationen und Experimente gedacht, nicht für die direkte Produktivnutzung ohne zusätzliche Fehlerbehandlung.
Probieren Sie DeepSeek V3.2 mit 20 % Rabatt aus!
Warum wird die developer-Rolle benötigt?
In realen Agent-Szenarien muss ein Modell oft gleichzeitig drei unterschiedliche Arten von Informationen verarbeiten:
- Die tatsächliche Absicht des Benutzers oder das Aufgabenziel
- Der eigene Reasoning- und Entscheidungsprozess des Modells
- Suchstrategien, Tool-Einschränkungen und Ausführungsregeln, die vom System oder Entwickler bereitgestellt werden
In früheren Versionen wurden diese Signale typischerweise in Benutzer- oder System-Prompts vermischt. Im Laufe der Zeit führte dies zu zwei großen Problemen. Erstens konnte das Modell Schwierigkeiten haben, die Benutzerabsicht von zwingenden Verhaltensbeschränkungen zu unterscheiden. Zweitens verschlechterte sich die Stabilität und Zuverlässigkeit des Tool-Aufrufs merklich, je komplexer die Toolchains wurden.
Die in DeepSeek-V3.2 eingeführte developer-Rolle dient im Wesentlichen als dedizierter Steuerungskanal für Suchagenten und toolorientierte Agenten. Sie ist dafür ausgelegt, Anweisungen zu übertragen, die strikt mit dem Agentenverhalten zusammenhängen, wie z. B. Suchbereich, Tool-Nutzungsreihenfolge oder Richtlinienbeschränkungen, ohne an der normalen Konversationssemantik teilzunehmen. Diese explizite Trennung ermöglicht ein klareres Kontextverständnis und schafft eine strukturelle Grundlage für ein skalierbareres und robusteres agentisches Training.
Wie greift man auf DeepSeek V3.2 in Claude Code zu?
Novita AI bietet derzeit die günstigste Full-Context-DeepSeek-V3.2-API an.
Novita AI bietet APIs mit 65K Kontext und Kosten von 0,269 $/Eingabe und 0,4 $/Ausgabe, die strukturierte Ausgabe und Funktionsaufrufe unterstützen, was eine starke Unterstützung für die Maximierung des Code-Agent-Potenzials von DeepSeek V3.2 bietet.
Cache-Lesen: 0,1345 $ / M Token” gibt die Kosten für das Lesen von zwischengespeicherten Tokens an, wenn ein Cache-Treffer auftritt. Diese Tokens wurden zuvor berechnet und gespeichert, sodass keine zusätzliche Modell-Inferenz erforderlich ist. In Systemen, in denen viele Anfragen den gleichen Prompt-Präfix teilen, Gesprächsverläufe, Tool-Anweisungen oder feste Regeltexte wiederverwenden oder in denen RAG-Abfrageergebnisse sehr repetitiv sind, kann eine hohe Cache-Trefferrate erreicht werden, was die gesamten Inferenzkosten deutlich senkt.
Schritt 1: API-Schlüssel abrufen
Schritt 1: Melden Sie sich bei Ihrem Konto an und klicken Sie auf die Schaltfläche „Modellbibliothek“.

Schritt 2: Wählen Sie Ihr Modell
Durchsuchen Sie die verfügbaren Optionen und wählen Sie das Modell, das Ihren Anforderungen entspricht.

Schritt 3: Starten Sie Ihre kostenlose Testversion
Starten Sie Ihre kostenlose Testversion, um die Funktionen des ausgewählten Modells zu erkunden.

Schritt 4: Holen Sie sich Ihren API-Schlüssel
Zur Authentifizierung bei der API stellen wir Ihnen einen neuen API-Schlüssel zur Verfügung. Auf der Seite „Einstellungen“ können Sie den API-Schlüssel wie in der Abbildung gezeigt kopieren.

Schritt 5: Installieren Sie die API
Installieren Sie die API mit dem für Ihre Programmiersprache spezifischen Paketmanager.
Nach der Installation importieren Sie die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit dem Novita AI LLM zu interagieren. Dies ist ein Beispiel für die Nutzung der Chat-Completions-API für Python-Nutzer.
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="deepseek/deepseek-v3.2",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=65536,
temperature=0.7
)
print(response.choices[0].message.content)
Nutzen Sie DeepSeek V3.2 mit Claude Code
Schritt 1: Installation von Claude Code
Stellen Sie vor der Installation von Claude Code sicher, dass Ihr System die Mindestanforderungen erfüllt. Node.js 18 oder höher muss in Ihrer lokalen Umgebung installiert sein. Sie können Ihre Node.js-Version überprüfen, indem Sie node --version in Ihrem Terminal ausführen.
Für Windows
Öffnen Sie die Eingabeaufforderung und führen Sie die folgenden Befehle aus:
npm install -g @anthropic-ai/claude-code
npx win-claude-code@latest
Die globale Installation stellt sicher, dass Claude Code von jedem Verzeichnis auf Ihrem System aus zugänglich ist. Der Befehl npx win-claude-code@latest lädt die neueste Windows-spezifische Version herunter und führt sie aus.
Für Mac und Linux
Öffnen Sie das Terminal und führen Sie Folgendes aus:
npm install -g @anthropic-ai/claude-code
Mac-Nutzer können direkt mit der globalen Installation fortfahren, ohne zusätzliche plattformspezifische Befehle zu benötigen. Der Installationsprozess konfiguriert automatisch die erforderlichen Abhängigkeiten und PATH-Variablen.
Schritt 2: Einrichten von Umgebungsvariablen
Umgebungsvariablen konfigurieren Claude Code zur Nutzung von DeepSeek v3.2 über die API-Endpunkte von Novita AI. Diese Variablen teilen Claude Code mit, wohin Anfragen gesendet werden und wie die Authentifizierung erfolgt.
Für Windows
Öffnen Sie die Eingabeaufforderung und legen Sie die folgenden Umgebungsvariablen fest:
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
set ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"
Ersetzen Sie <Novita API Key> durch Ihren tatsächlichen API-Schlüssel, den Sie von der Novita AI-Plattform erhalten haben. Diese Variablen bleiben für die aktuelle Sitzung aktiv und müssen zurückgesetzt werden, wenn Sie die Eingabeaufforderung schließen.
Für Mac und Linux
Öffnen Sie das Terminal und exportieren Sie die folgenden Umgebungsvariablen:
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"
Schritt 3: Starten von Claude Code
Nach Abschluss der Installation und Konfiguration können Sie Claude Code jetzt in Ihrem Projektverzeichnis starten. Navigieren Sie mit dem Befehl cd zu Ihrem gewünschten Projektstandort:
cd <your-project-directory>
claude .
Der Punkt (.)-Parameter weist Claude Code an, im aktuellen Verzeichnis zu arbeiten. Nach dem Start sehen Sie die Claude Code-Eingabeaufforderung in einer interaktiven Sitzung.
Dies zeigt an, dass das Tool bereit ist, Ihre Anweisungen entgegenzunehmen. Die Oberfläche bietet eine saubere, intuitive Umgebung für natürliche Sprachprogrammier-Interaktionen.
Schritt 4: Nutzung von Claude Code in VSCode oder Cursor
Claude Code integriert sich nahtlos in beliebte Entwicklungsumgebungen. Es verbessert Ihren bestehenden Workflow, anstatt ihn zu ersetzen.
Sie können Claude Code direkt im Terminal von VSCode oder Cursor verwenden. Dadurch behalten Sie den Zugriff auf Ihre vertrauten Entwicklungstools und nutzen gleichzeitig die KI-Unterstützung.
Zusätzlich sind Claude Code-Plugins für sowohl VSCode als auch Cursor verfügbar.
Wie verwendet man externe Modelle in Claude Code?
Wenn Sie in Ihrem Entwicklungs-Workflow dynamisch zwischen verschiedenen großen Sprachmodellen (z. B. Anthropics Claude, Zhipus GLM und Moonshots Kimi) wechseln möchten, gibt es Strategien, dies ohne umfangreiche Codeänderungen zu tun. Dieser Abschnitt erklärt, wie Sie Modelle schnell mithilfe einheitlicher APIs und Konfigurationsschalter austauschen können.
Verwendung von Umgebungsvariablen (Claude Code-Ansatz):
Wenn Sie mit Tools wie Claude Code oder einem SDK arbeiten, das an eine bestimmte API gebunden ist, können Sie Modelle einfach durch Anpassen Ihrer Umgebungskonfiguration wechseln. Novita AI bietet mehrere Modelloptionen, mit denen Sie experimentieren können, um die beste Passform zu finden.

Sehen Sie sich jetzt andere Modelle an!
DeepSeek V3.2 führt DSA als gezieltes Architektur-Upgrade ein, das die Rechenkosten erheblich senkt, die Langkontext-Effektivität erhöht und die codezentrierte Genauigkeit verbessert, während es eine wettbewerbsfähige Reasoning-Leistung beibehält. Das Modell ermöglicht eine skalierbare Analyse großer Repositories und komplexer technischer Dokumente und zeigt im Vergleich zu DeepSeek V3.1-Terminus und proprietären Alternativen ein günstiges Gleichgewicht zwischen Effizienz und Funktionsumfang. Diese Fortschritte etablieren DeepSeek V3.2 als kosteneffektive Lösung für nachhaltige Entwicklungs-Workflows und Langkontext-KI-Anwendungen.
Häufig gestellte Fragen
Was ist der Hauptvorteil von DeepSeek Sparse Attention (DSA) in DeepSeek V3.2?
DeepSeek V3.2 nutzt DSA, um Attention-Verbindungen selektiv zu aktivieren, was die quadratischen Attention-Kosten reduziert und gleichzeitig ein genaues Codeverständnis über lange Kontexte hinweg beibehält.
Wie unterscheidet sich DeepSeek V3.2 von DeepSeek V3.1-Terminus in praktischen Codierungs-Workflows?
DeepSeek V3.2 bietet im Vergleich zu DeepSeek V3.1-Terminus niedrigere Betriebskosten, ein 128K-Kontextfenster und eine schnellere Inferenzstabilität, was zu einer effizienteren Codeanalyse auf Repository-Ebene führt.
Verbessert DeepSeek V3.2 die Verarbeitung von technischen Dokumenten mit langem Kontext?
Ja. DeepSeek V3.2 unterstützt die gleichzeitige Analyse komplexer Dokumente und dateiübergreifender Beziehungen und übertrifft DeepSeek V3.1-Terminus bei mehrdokumentigen Reasoning-Aufgaben.
Novita AI ist die All-in-One-Cloud-Plattform, die Ihre KI-Ambitionen unterstützt. Integrierte APIs, Serverless, GPU-Instanzen – die kosteneffektiven Tools, die Sie brauchen. Eliminieren Sie Infrastruktur, starten Sie kostenlos und machen Sie Ihre KI-Vision zur Realität.
Empfohlene Lektüre
So greifen Sie auf Qwen 3 Coder zu: Qwen Code; Claude Code; Trae
DeepSeek vs. Qwen: Finden Sie heraus, welches Ökosystem zu Ihren Produktionsanforderungen passt
Kosten von DeepSeek R1 0528: Vergleich von API, GPU und On-Prem

