So greifen Sie auf DeepSeek V3.1 zu: Ein umfassender Leitfaden

Inhaltsverzeichnis

Grundlegende Einführung
Benchmark
Wichtige Verbesserungen
So greifen Sie auf DeepSeek V3.1 zu: Lokale Bereitstellung
So greifen Sie auf DeepSeek V3.1 zu: Verwenden der API
So greifen Sie auf DeepSeek V3.1 zu: Claude-Code-Integration
So greifen Sie auf DeepSeek V3.1 zu: Verbindung mit anderen Drittanbieterplattformen

DeepSeek V3.1 ist das neueste Flaggschiff-Modell von DeepSeek, das entwickelt wurde, um die KI-Leistung mit einer hybriden Reasoning-Architektur, höherer Denkeffizienz und stärkeren Agentenfähigkeiten voranzutreiben. Diese Innovationen bieten Entwicklern eine leistungsstarke Grundlage, um intelligentere Anwendungen zu entwickeln und reale Aufgaben zu optimieren.

Dieser Leitfaden stellt DeepSeek V3.1 vor, hebt seine Kernfunktionen und Benchmark-Stärken hervor und zeigt, wie Sie darauf über lokale Bereitstellung, APIs und Drittanbieterplattformen zugreifen können.

Starten Sie Ihre kostenlose Testversion mit DeepSeek V3.1!

Grundlegende Einführung

Merkmal	Detail
Gesamtparameter	671B
Aktivierte Parameter	37B
Kontextlänge	128K
Architektur	Transformer-based MoE
Denkmodus	Hybrid thinking mode (Think + Non-Think)
Lizenz	MIT license

Benchmark

DeepSeek V3.1 (Reasoning) liefert bei anspruchsvollen Aufgaben wie AIME-Wettbewerbsmathematik und GPQA-wissenschaftlichem Reasoning eine stärkere logische Kettenkonstruktion, ein besseres Langkontextverständnis und konsistentere Antworten, was es ideal für hochpräzise, tiefenorientierte Anwendungen macht.

DeepSeek V3.1 (Non-Reasoning) bietet eine ausgewogene Leistung mit höherer Effizienz und Kosteneffektivität für allgemeine Workloads. Zusammen ermöglichen sie Entwicklern, flexibel zwischen rigoroser Reasoning-Tiefe und praktischer Allgemeineffizienz zu wählen.

Wichtige Verbesserungen

Hybride Inferenz: DeepSeek V3.1 vereint Think- und Non-Think-Modi in einem Modell.
Schnelleres Denken: DeepSeek V3.1 Think erreicht eine vergleichbare Antwortqualität wie DeepSeek-R1-0528, antwortet jedoch schneller.
Stärkere Agentenfähigkeiten: DeepSeek V3.1 nutzt Post-Training, um die Werkzeugnutzung zu verbessern und komplexe mehrstufige Aufgaben zu bewältigen.

So greifen Sie auf DeepSeek V3.1 zu: Lokale Bereitstellung

Anforderungen von DeepSeek V3.1

Typ	VRAM (ca.)	Empfohlene Hardware
1-Bit	186 GB	Einzelne High-End-GPU / Multi-GPU-Server
2-Bit	219 GB	Multi-GPU-Server
3-Bit	319 GB	Multi-GPU-Server
4-Bit	404 GB	Multi-GPU-Server
8-Bit	713 GB	Große GPU-Cluster
16-Bit (BF16)	1,34 TB	Nvidia H200 8-Karten-Cluster

DeepSeek V3.1 unterstützt die lokale Bereitstellung mit folgender Hardware und Open-Source-Community-Software.

DeepSeek-Infer Demo: Eine einfache und leichte Demo für FP8- und BF16-Inferenz.
SGLang: Volle Unterstützung für DeepSeek-V3 in BF16- und FP8-Modi, Multi-Token Prediction folgt in Kürze.
LMDeploy: Bietet effiziente FP8- und BF16-Inferenz für lokale und Cloud-Bereitstellung.
TensorRT-LLM: Unterstützt derzeit BF16-Inferenz und INT4/INT8-Quantisierung, FP8-Unterstützung in Kürze.
vLLM: Unterstützt DeepSeek-V3 mit FP8 und BF16 für Tensor- und Pipeline-Parallelität.
LightLLM: Effiziente Single-Node- oder Multi-Node-Bereitstellung für FP8 und BF16.
AMD-GPU: Ausführung von DeepSeek-V3 auf AMD-GPUs über SGLang sowohl im BF16- als auch im FP8-Modus.
Huawei Ascend NPU: Ausführung von DeepSeek-V3 auf Huawei-Ascend-Geräten im INT8- und BF16-Modus.

Während DeepSeek V3.1 mit erheblichen Hardwareanforderungen lokal bereitgestellt werden kann, bietet Novita AI auch optimierte Cloud-GPU-Lösungen (H100 und H200), wodurch die Notwendigkeit entfällt, komplexe Infrastruktur zu verwalten.

So greifen Sie auf DeepSeek V3.1 zu: Verwenden der API

Novita AI stellt DeepSeek V3.1 APIs mit 163,8K Kontext und Kosten von 0,55 $ / 1M Input-Tokens und 1,66 $ / 1M Output-Tokens bereit.

Option 1: Direkte API-Integration (Python-Beispiel)

Schritt 1: Einloggen und auf die Modellbibliothek zugreifen

Loggen Sie sich in Ihr Konto ein oder registrieren Sie sich und klicken Sie auf die Schaltfläche Modellbibliothek.

DeepSeek V3.1 jetzt testen!

Schritt 2: Wählen Sie Ihr Modell

Durchsuchen Sie die verfügbaren Optionen und wählen Sie das Modell aus, das Ihren Anforderungen entspricht.

Schritt 3: Starten Sie Ihre kostenlose Testversion

Beginnen Sie Ihre kostenlose Testversion, um die Fähigkeiten des ausgewählten Modells zu erkunden.

Schritt 4: API-Schlüssel abrufen

Zur Authentifizierung mit der API stellen wir Ihnen einen neuen API-Schlüssel zur Verfügung. Rufen Sie die Seite „Einstellungen“ auf und kopieren Sie den API-Schlüssel wie im Bild gezeigt.

Schritt 5: API installieren

Installieren Sie die API mit dem für Ihre Programmiersprache spezifischen Paketmanager.

Importieren Sie nach der Installation die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit Novita AI LLM zu interagieren. Dies ist ein Beispiel für die Verwendung der Chat-Completions-API für Python-Benutzer.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key="",
)

model = "deepseek/deepseek-v3.1"
stream = True # or False
max_tokens = 81920
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Option 2: Multi-Agent-Workflows mit OpenAI Agents SDK

Erstellen Sie anspruchsvolle Multi-Agent-Systeme, die die Dual-Mode-Fähigkeiten von DeepSeek V3.1 nutzen:

Plug-and-Play-Integration: Verwenden Sie DeepSeek V3.1 in jedem OpenAI Agents-Workflow
Erweiterte Agentenfähigkeiten: Unterstützung für Übergaben, Routing und Tool-Integration
Skalierbare Architektur: Entwickeln Sie Agenten, die die Fähigkeiten von DeepSeek V3.1 nutzen

So greifen Sie auf DeepSeek V3.1 zu: Claude-Code-Integration

Schritt 1: Claude Code installieren

Stellen Sie vor der Installation von Claude Code sicher, dass Ihr System die Mindestanforderungen erfüllt. Node.js 18 oder höher muss in Ihrer lokalen Umgebung installiert sein. Sie können Ihre Node.js-Version überprüfen, indem Sie node --version in Ihrem Terminal ausführen.

Öffnen Sie die Eingabeaufforderung (Windows) oder das Terminal (Mac/Linux) und führen Sie Folgendes aus:

npm install -g @anthropic-ai/claude-code

Die globale Installation stellt sicher, dass Claude Code von jedem Verzeichnis auf Ihrem System aus zugänglich ist. Der Installationsprozess konfiguriert automatisch die erforderlichen Abhängigkeiten und PATH-Variablen auf allen Plattformen.

Schritt 2: Umgebungsvariablen einrichten

Umgebungsvariablen konfigurieren Claude Code für die Verwendung von DeepSeek V3.1 über die API-Endpunkte von Novita AI. Diese Variablen teilen Claude Code mit, wohin Anfragen gesendet werden und wie die Authentifizierung erfolgt.

Für Windows

Öffnen Sie die Eingabeaufforderung und setzen Sie die folgenden Umgebungsvariablen:

set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL=deepseek/deepseek-v3.1
set ANTHROPIC_SMALL_FAST_MODEL=deepseek/deepseek-v3.1

Ersetzen Sie <Novita API Key> durch Ihren tatsächlichen API-Schlüssel von der Novita AI-Plattform. Diese Variablen bleiben für die aktuelle Sitzung aktiv und müssen zurückgesetzt werden, wenn Sie die Eingabeaufforderung schließen.

Für Mac und Linux

Öffnen Sie das Terminal und exportieren Sie die folgenden Umgebungsvariablen:

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.1"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.1"

Schritt 3: Claude Code starten

Nach Abschluss der Installation und Konfiguration können Sie Claude Code jetzt in Ihrem Projektverzeichnis starten. Navigieren Sie mit dem Befehl cd zu Ihrem gewünschten Projektverzeichnis:

cd <your-project-directory>
claude .

Der Parameter Punkt (.) weist Claude Code an, im aktuellen Verzeichnis zu arbeiten. Nach dem Start erscheint die Claude Code-Eingabeaufforderung in einer interaktiven Sitzung.

Dies zeigt an, dass das Tool bereit ist, Ihre Anweisungen entgegenzunehmen. Die Oberfläche bietet eine klare, intuitive Umgebung für Interaktionen mit natürlicher Sprachprogrammierung.

Schritt 4: Ihr erstes Projekt erstellen

Claude Code zeichnet sich dadurch aus, dass es detaillierte Projektbeschreibungen in funktionale Anwendungen umsetzt. Geben Sie Ihre Eingabeaufforderung ein und drücken Sie die Eingabetaste, um die Aufgabe zu starten. Claude Code analysiert Ihre Anforderungen, erstellt die erforderlichen Dateien, implementiert die Funktionalität und stellt eine vollständige Projektstruktur mit Dokumentation bereit.

So greifen Sie auf DeepSeek V3.1 zu: Verbindung mit anderen Drittanbieterplattformen

Entwicklungstools: Nahtlose Integration mit gängigen IDEs und Entwicklungsumgebungen wie Cursor, Trae, Qwen Code und Cline über OpenAI-kompatible und Anthropic-kompatible APIs.

Orchestrierungs-Frameworks: Verbindung mit LangChain, Dify, CrewAI, Langflow und anderen KI-Orchestrierungsplattformen über offizielle Konnektoren.

Hugging Face Integration: Novita AI fungiert als offizieller Inferenzanbieter von Hugging Face und gewährleistet eine breite Ökosystemkompatibilität.

FAQ

Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen, und gleichzeitig eine erschwingliche und zuverlässige GPU-Cloud für den Aufbau und die Skalierung bereitstellt.

Empfohlene Lektüre

DeepSeek-V3.1 jetzt auf Novita AI verfügbar: Erweitertes Kontextfenster und revolutionärer hybrider Denkmodus

DeepSeek R1 7B: 90 % der Leistung von DeepSeek R1 bei 10-facher Hardware-Effizienz

DeepSeek V3 0324 jetzt auf Novita AI verfügbar

So greifen Sie auf DeepSeek V3.1 zu: Ein umfassender Leitfaden

Grundlegende Einführung

Benchmark

Wichtige Verbesserungen

So greifen Sie auf DeepSeek V3.1 zu: Lokale Bereitstellung

Anforderungen von DeepSeek V3.1

So greifen Sie auf DeepSeek V3.1 zu: Verwenden der API

Option 1: Direkte API-Integration (Python-Beispiel)

Option 2: Multi-Agent-Workflows mit OpenAI Agents SDK

So greifen Sie auf DeepSeek V3.1 zu: Claude-Code-Integration

So greifen Sie auf DeepSeek V3.1 zu: Verbindung mit anderen Drittanbieterplattformen

FAQ

Empfohlene Lektüre

Product

RESOURCES

Partners

Company

Grundlegende Einführung

Benchmark

Wichtige Verbesserungen

So greifen Sie auf DeepSeek V3.1 zu: Lokale Bereitstellung

Anforderungen von DeepSeek V3.1

So greifen Sie auf DeepSeek V3.1 zu: Verwenden der API

Option 1: Direkte API-Integration (Python-Beispiel)

Option 2: Multi-Agent-Workflows mit OpenAI Agents SDK

So greifen Sie auf DeepSeek V3.1 zu: Claude-Code-Integration

So greifen Sie auf DeepSeek V3.1 zu: Verbindung mit anderen Drittanbieterplattformen

FAQ

Empfohlene Lektüre

Ähnliche Beiträge

Product

RESOURCES

Partners

Company