- Grundlegende Einführung
- Benchmark
- Wichtige Verbesserungen
- So greifen Sie auf DeepSeek V3.1 zu: Lokale Bereitstellung
- So greifen Sie auf DeepSeek V3.1 zu: Verwenden der API
- So greifen Sie auf DeepSeek V3.1 zu: Claude-Code-Integration
- So greifen Sie auf DeepSeek V3.1 zu: Verbindung mit anderen Drittanbieterplattformen
DeepSeek V3.1 ist das neueste Flaggschiff-Modell von DeepSeek, das entwickelt wurde, um die KI-Leistung mit einer hybriden Reasoning-Architektur, höherer Denkeffizienz und stärkeren Agentenfähigkeiten voranzutreiben. Diese Innovationen bieten Entwicklern eine leistungsstarke Grundlage, um intelligentere Anwendungen zu entwickeln und reale Aufgaben zu optimieren.
Dieser Leitfaden stellt DeepSeek V3.1 vor, hebt seine Kernfunktionen und Benchmark-Stärken hervor und zeigt, wie Sie darauf über lokale Bereitstellung, APIs und Drittanbieterplattformen zugreifen können.
Starten Sie Ihre kostenlose Testversion mit DeepSeek V3.1!
Grundlegende Einführung
| Merkmal | Detail |
|---|---|
| Gesamtparameter | 671B |
| Aktivierte Parameter | 37B |
| Kontextlänge | 128K |
| Architektur | Transformer-based MoE |
| Denkmodus | Hybrid thinking mode (Think + Non-Think) |
| Lizenz | MIT license |
Benchmark

DeepSeek V3.1 (Reasoning) liefert bei anspruchsvollen Aufgaben wie AIME-Wettbewerbsmathematik und GPQA-wissenschaftlichem Reasoning eine stärkere logische Kettenkonstruktion, ein besseres Langkontextverständnis und konsistentere Antworten, was es ideal für hochpräzise, tiefenorientierte Anwendungen macht.
DeepSeek V3.1 (Non-Reasoning) bietet eine ausgewogene Leistung mit höherer Effizienz und Kosteneffektivität für allgemeine Workloads. Zusammen ermöglichen sie Entwicklern, flexibel zwischen rigoroser Reasoning-Tiefe und praktischer Allgemeineffizienz zu wählen.
Wichtige Verbesserungen
- Hybride Inferenz: DeepSeek V3.1 vereint Think- und Non-Think-Modi in einem Modell.
- Schnelleres Denken: DeepSeek V3.1 Think erreicht eine vergleichbare Antwortqualität wie DeepSeek-R1-0528, antwortet jedoch schneller.
- Stärkere Agentenfähigkeiten: DeepSeek V3.1 nutzt Post-Training, um die Werkzeugnutzung zu verbessern und komplexe mehrstufige Aufgaben zu bewältigen.
So greifen Sie auf DeepSeek V3.1 zu: Lokale Bereitstellung
Anforderungen von DeepSeek V3.1
| Typ | VRAM (ca.) | Empfohlene Hardware |
|---|---|---|
| 1-Bit | 186 GB | Einzelne High-End-GPU / Multi-GPU-Server |
| 2-Bit | 219 GB | Multi-GPU-Server |
| 3-Bit | 319 GB | Multi-GPU-Server |
| 4-Bit | 404 GB | Multi-GPU-Server |
| 8-Bit | 713 GB | Große GPU-Cluster |
| 16-Bit (BF16) | 1,34 TB | Nvidia H200 8-Karten-Cluster |
DeepSeek V3.1 unterstützt die lokale Bereitstellung mit folgender Hardware und Open-Source-Community-Software.
- DeepSeek-Infer Demo: Eine einfache und leichte Demo für FP8- und BF16-Inferenz.
- SGLang: Volle Unterstützung für DeepSeek-V3 in BF16- und FP8-Modi, Multi-Token Prediction folgt in Kürze.
- LMDeploy: Bietet effiziente FP8- und BF16-Inferenz für lokale und Cloud-Bereitstellung.
- TensorRT-LLM: Unterstützt derzeit BF16-Inferenz und INT4/INT8-Quantisierung, FP8-Unterstützung in Kürze.
- vLLM: Unterstützt DeepSeek-V3 mit FP8 und BF16 für Tensor- und Pipeline-Parallelität.
- LightLLM: Effiziente Single-Node- oder Multi-Node-Bereitstellung für FP8 und BF16.
- AMD-GPU: Ausführung von DeepSeek-V3 auf AMD-GPUs über SGLang sowohl im BF16- als auch im FP8-Modus.
- Huawei Ascend NPU: Ausführung von DeepSeek-V3 auf Huawei-Ascend-Geräten im INT8- und BF16-Modus.
Während DeepSeek V3.1 mit erheblichen Hardwareanforderungen lokal bereitgestellt werden kann, bietet Novita AI auch optimierte Cloud-GPU-Lösungen (H100 und H200), wodurch die Notwendigkeit entfällt, komplexe Infrastruktur zu verwalten.
So greifen Sie auf DeepSeek V3.1 zu: Verwenden der API
Novita AI stellt DeepSeek V3.1 APIs mit 163,8K Kontext und Kosten von 0,55 $ / 1M Input-Tokens und 1,66 $ / 1M Output-Tokens bereit.
Option 1: Direkte API-Integration (Python-Beispiel)
Schritt 1: Einloggen und auf die Modellbibliothek zugreifen
Loggen Sie sich in Ihr Konto ein oder registrieren Sie sich und klicken Sie auf die Schaltfläche Modellbibliothek.

Schritt 2: Wählen Sie Ihr Modell
Durchsuchen Sie die verfügbaren Optionen und wählen Sie das Modell aus, das Ihren Anforderungen entspricht.

Schritt 3: Starten Sie Ihre kostenlose Testversion
Beginnen Sie Ihre kostenlose Testversion, um die Fähigkeiten des ausgewählten Modells zu erkunden.

Schritt 4: API-Schlüssel abrufen
Zur Authentifizierung mit der API stellen wir Ihnen einen neuen API-Schlüssel zur Verfügung. Rufen Sie die Seite „Einstellungen“ auf und kopieren Sie den API-Schlüssel wie im Bild gezeigt.

Schritt 5: API installieren
Installieren Sie die API mit dem für Ihre Programmiersprache spezifischen Paketmanager.
Importieren Sie nach der Installation die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit Novita AI LLM zu interagieren. Dies ist ein Beispiel für die Verwendung der Chat-Completions-API für Python-Benutzer.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="",
)
model = "deepseek/deepseek-v3.1"
stream = True # or False
max_tokens = 81920
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Option 2: Multi-Agent-Workflows mit OpenAI Agents SDK
Erstellen Sie anspruchsvolle Multi-Agent-Systeme, die die Dual-Mode-Fähigkeiten von DeepSeek V3.1 nutzen:
- Plug-and-Play-Integration: Verwenden Sie DeepSeek V3.1 in jedem OpenAI Agents-Workflow
- Erweiterte Agentenfähigkeiten: Unterstützung für Übergaben, Routing und Tool-Integration
- Skalierbare Architektur: Entwickeln Sie Agenten, die die Fähigkeiten von DeepSeek V3.1 nutzen
So greifen Sie auf DeepSeek V3.1 zu: Claude-Code-Integration
Schritt 1: Claude Code installieren
Stellen Sie vor der Installation von Claude Code sicher, dass Ihr System die Mindestanforderungen erfüllt. Node.js 18 oder höher muss in Ihrer lokalen Umgebung installiert sein. Sie können Ihre Node.js-Version überprüfen, indem Sie node --version in Ihrem Terminal ausführen.
Öffnen Sie die Eingabeaufforderung (Windows) oder das Terminal (Mac/Linux) und führen Sie Folgendes aus:
npm install -g @anthropic-ai/claude-code
Die globale Installation stellt sicher, dass Claude Code von jedem Verzeichnis auf Ihrem System aus zugänglich ist. Der Installationsprozess konfiguriert automatisch die erforderlichen Abhängigkeiten und PATH-Variablen auf allen Plattformen.
Schritt 2: Umgebungsvariablen einrichten
Umgebungsvariablen konfigurieren Claude Code für die Verwendung von DeepSeek V3.1 über die API-Endpunkte von Novita AI. Diese Variablen teilen Claude Code mit, wohin Anfragen gesendet werden und wie die Authentifizierung erfolgt.
- Für Windows
Öffnen Sie die Eingabeaufforderung und setzen Sie die folgenden Umgebungsvariablen:
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL=deepseek/deepseek-v3.1
set ANTHROPIC_SMALL_FAST_MODEL=deepseek/deepseek-v3.1
Ersetzen Sie <Novita API Key> durch Ihren tatsächlichen API-Schlüssel von der Novita AI-Plattform. Diese Variablen bleiben für die aktuelle Sitzung aktiv und müssen zurückgesetzt werden, wenn Sie die Eingabeaufforderung schließen.
- Für Mac und Linux
Öffnen Sie das Terminal und exportieren Sie die folgenden Umgebungsvariablen:
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.1"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.1"
Schritt 3: Claude Code starten
Nach Abschluss der Installation und Konfiguration können Sie Claude Code jetzt in Ihrem Projektverzeichnis starten. Navigieren Sie mit dem Befehl cd zu Ihrem gewünschten Projektverzeichnis:
cd <your-project-directory>
claude .
Der Parameter Punkt (.) weist Claude Code an, im aktuellen Verzeichnis zu arbeiten. Nach dem Start erscheint die Claude Code-Eingabeaufforderung in einer interaktiven Sitzung.
Dies zeigt an, dass das Tool bereit ist, Ihre Anweisungen entgegenzunehmen. Die Oberfläche bietet eine klare, intuitive Umgebung für Interaktionen mit natürlicher Sprachprogrammierung.
Schritt 4: Ihr erstes Projekt erstellen
Claude Code zeichnet sich dadurch aus, dass es detaillierte Projektbeschreibungen in funktionale Anwendungen umsetzt. Geben Sie Ihre Eingabeaufforderung ein und drücken Sie die Eingabetaste, um die Aufgabe zu starten. Claude Code analysiert Ihre Anforderungen, erstellt die erforderlichen Dateien, implementiert die Funktionalität und stellt eine vollständige Projektstruktur mit Dokumentation bereit.
So greifen Sie auf DeepSeek V3.1 zu: Verbindung mit anderen Drittanbieterplattformen
Entwicklungstools: Nahtlose Integration mit gängigen IDEs und Entwicklungsumgebungen wie Cursor, Trae, Qwen Code und Cline über OpenAI-kompatible und Anthropic-kompatible APIs.
Orchestrierungs-Frameworks: Verbindung mit LangChain, Dify, CrewAI, Langflow und anderen KI-Orchestrierungsplattformen über offizielle Konnektoren.
Hugging Face Integration: Novita AI fungiert als offizieller Inferenzanbieter von Hugging Face und gewährleistet eine breite Ökosystemkompatibilität.
FAQ
Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen, und gleichzeitig eine erschwingliche und zuverlässige GPU-Cloud für den Aufbau und die Skalierung bereitstellt.
Empfohlene Lektüre
DeepSeek R1 7B: 90 % der Leistung von DeepSeek R1 bei 10-facher Hardware-Effizienz
