Deepseek R1 Distill Qwen 32B Zugangsanleitung: Lokal oder API?

Inhaltsverzeichnis

Deepseek R1 Distill Qwen 32B Grundlegende Einführung
Basisinformationen
Sprachunterstützung
Wichtige Highlights
Multimodale Fähigkeiten
Training
So greifen Sie lokal auf Deepseek R1 Distill Qwen 32B zu
Herausforderungen bei der lokalen Bereitstellung
So greifen Sie über Novita AI auf Deepseek R1 Distill Qwen 32B zu
Welche Methoden sind für Sie geeignet?

Wichtige Highlights

Leistungsstark und dennoch effizient: Übertrifft die Leistung größerer Modelle mit geringerem Ressourcenbedarf.

Benchmark-Führer: Hervorragend in AIME 2024 und SWE-bench Verified, übertrifft OpenAI-o1-mini.

Mehrsprachige Unterstützung: Verarbeitet 29+ Sprachen, darunter Chinesisch, Englisch und Französisch.

Erweiterte Funktionen: Unterstützt lange Texte (8K+ Tokens), strukturierte Ausgaben und Rollenspielszenarien.

Einfacher Zugang: Verfügbar über Ollama für lokale Bereitstellung oder Novita AI API zur Integration.

Empfehlen Sie Ihren Freunden Novita AI weiter, und Sie beide erhalten $10 an LLM-API-Guthaben – bis zu $500 Gesamtbelohnungen.

Um die Entwicklercommunity zu unterstützen, sind Qwen2.5-7B, Qwen 3 0.6B, Qwen 3 1.7B, Qwen 3 4B derzeit kostenlos auf Novita AI verfügbar.

Der DeepSeek R1 Distill Qwen 32B ist ein hochmodernes destilliertes Modell, das die Leistung größerer Modelle mit deutlich geringeren Hardwareanforderungen bietet. Seine feinabgestimmte Architektur liefert überlegene Leistung und übertrifft in Benchmarks konsequent Modelle wie OpenAI-o1-mini. Entwickelt für Effizienz und Zugänglichkeit, unterstützt es lokale Bereitstellung und nahtlose API-Integration, was es ideal für Entwickler, Forscher und Unternehmen gleichermaßen macht.

Deepseek R1 Distill Qwen 32B Grundlegende Einführung

Basisinformationen

Modellgröße

32,8B

Open Source

Architektur

Transformer

Sprachunterstützung

Mehrsprachige Unterstützung für über 29 Sprachen, darunter:

Chinesisch Englisch Französisch Spanisch Portugiesisch Deutsch Italienisch Russisch Japanisch Koreanisch Vietnamesisch Thailändisch Arabisch und mehr…

Wichtige Highlights

Deutliche Verbesserungen bei der Befehlsbefolgung und der Generierung langer Texte (über 8K Tokens).
Verbessertes Verständnis strukturierter Daten (z. B. Tabellen) und Generierung strukturierter Ausgaben, insbesondere JSON.
Höhere Robustheit gegenüber verschiedenen Systemaufforderungen, Verbesserung der Rollenspielumsetzung und der Bedingungssetzung für Chatbots.

Multimodale Fähigkeiten

Unterstützt Text-zu-Text-Transformationen.

Training

Feinabstimmung von Qwen 2.5 32B mit DeepSeek R1 als Lehrer, um eine ähnliche Leistung wie größere Modelle zu erzielen.

DeepSeek hat wirklich etwas Besonderes mit der Destillation des großen R1-Modells in andere Open-Source-Modelle erreicht. Insbesondere die Fusion mit Qwen-32B scheint massive Steigerungen in den Benchmarks zu liefern und macht es zum bevorzugten Modell für Leute mit weniger VRAM, da es insgesamt die besten Ergebnisse im Vergleich zur Llama-70B-Destillation liefert. Derzeit der SOTA für lokale LLMs, und es sollte selbst auf Consumer-Hardware recht leistungsfähig sein.

Benchmark

Benchmark	DeepSeek-R1-32B	OpenAI-o1-mini	Anderes Modell
AIME 2024	72,6%	63,6%	Llama-70B: 70,0%, QwQ-32B: 50,0%
Codeforces	71,5%	60,0%	Llama-70B: 57,5%, QwQ-32B: 54,5%
GPQA Diamond	62,1%	60,0%	Llama-70B: 65,2%, QwQ-32B: 54,5%
MATH-500	75,7%	90,0%	Llama-70B: 94,5%, QwQ-32B: 90,6%
MMLU	90,8%	88,5%	Llama-70B: 91,8%, QwQ-32B: 90,6%
SWE-bench Verified	49,2%	36,8%	Llama-70B: 57,5%, QwQ-32B: 41,6%

Deepseek R1 Distill Qwen 32B zeichnet sich in AIME 2024 und SWE-bench Verified aus, übertrifft OpenAI-o1-mini bei einigen Aufgaben leicht, bleibt aber in Benchmarks, die fortgeschrittene Argumentations- oder Mathematikfähigkeiten erfordern, im Allgemeinen hinter größeren Modellen wie Deepseek R1 Llama 70B zurück.

So greifen Sie lokal auf Deepseek R1 Distill Qwen 32B zu

https://youtu.be/BTNZ1tmVkzA

Hardware-Anforderungen

Modellgröße: 73,21 GB

1 × H100 (80GB): Hochleistungs-GPU für Training.
1 × A100 (80GB): Hochspeicher-GPU für große Datensätze.
2 × L40s (96GB): Fortschrittliche Inferenz-GPUs mit erweitertem Speicher.
4 × RTX 4090 (96GB): Leistungsstarke GPUs für verteilte Aufgaben.

Schritt-für-Schritt-Installationsanleitung

# Guide: Install and Use DeepSeek-R1 with Ollama

# 1. Install Ollama
# Visit the Ollama website, download and install the version for your OS:
# https://ollama.ai/

# 2. Download the DeepSeek-R1 Model
# Open your terminal and run the command below to download the model 
# (using the 7B parameter version as an example):
ollama run deepseek-r1:7b
# Wait for the download to complete. The time required will depend on your network speed.

# 3. Verify Installation and Start the Model
# Verify that the model has been successfully downloaded:
ollama list
# Ensure "deepseek-r1" appears in the list.

# Start the 32B version of the model:
ollama run deepseek-r1:32b

# 4. Usage Examples
# Ask a query:
>>> "Explain quantum computing in simple terms."

# Generate code:
>>> "Write a Python function to calculate the Fibonacci sequence."

Herausforderungen bei der lokalen Bereitstellung

Hardware-Einschränkungen: Hoher Ressourcenbedarf, teure Upgrades.
Modellgröße: Großer Speicherbedarf (z. B. 70+ GB), langsame Downloads.
Software-Kompatibilität: Abhängigkeits- und Betriebssystemprobleme.
Leistungsoptimierung: Latenz-, Batching- und Parallelitätsprobleme.
Speicherverwaltung: GPU-Speichergrenzen und Kompromisse bei der Ausführung außerhalb des Speichers.
Wartung: Häufige Updates und Kompatibilitätsprobleme.
Sicherheit: Gewährleistung des Datenschutzes in lokalen Umgebungen.
Dokumentation: Begrenzte Unterstützung und Probleme bei der Fehlerbehebung.

So greifen Sie über Novita AI auf Deepseek R1 Distill Qwen 32B zu

Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen und gleichzeitig eine erschwingliche und zuverlässige GPU-Cloud zum Aufbauen und Skalieren bereitstellt.

Schritt 1: Anmelden und auf die Modellbibliothek zugreifen

Melden Sie sich in Ihrem Konto an und klicken Sie auf die Schaltfläche Modellbibliothek.

Testen Sie Deepseek R1 Distill Qwen 32B Demo jetzt!

Schritt 2: Wählen Sie Ihr Modell

Durchsuchen Sie die verfügbaren Optionen und wählen Sie das Modell aus, das Ihren Anforderungen entspricht.

Schritt 3: Starten Sie Ihre kostenlose Testversion

Beginnen Sie Ihre kostenlose Testversion, um die Fähigkeiten des ausgewählten Modells zu erkunden.

Schritt 4: Holen Sie sich Ihren API-Schlüssel

Zur Authentifizierung mit der API stellen wir Ihnen einen neuen API-Schlüssel zur Verfügung. Rufen Sie die Seite „Einstellungen“ auf und kopieren Sie den API-Schlüssel wie im Bild gezeigt.

Schritt 5: Installieren Sie die API

Installieren Sie die API mit dem für Ihre Programmiersprache spezifischen Paketmanager.

Importieren Sie nach der Installation die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit Novita AI LLM zu interagieren. Dies ist ein Beispiel für die Verwendung der Chat Completions API für Python-Benutzer.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="&lt;YOUR Novita AI API Key&gt;",
)

model = "deepseek/deepseek-r1-distill-qwen-32b"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Welche Methoden sind für Sie geeignet?

Das DeepSeek R1 Distill Qwen 32B-Modell ist ein hochmodernes lokales Sprachmodell, das überlegene Leistung bei der Befehlsbefolgung, der Verarbeitung strukturierter Daten und der mehrsprachigen Unterstützung bietet. Die Feinabstimmung mit DeepSeek R1 als Lehrer gewährleistet Effizienz, was es für Forscher, Entwickler und Unternehmen geeignet macht. Trotz der Hardwareanforderungen bietet es ein Gleichgewicht zwischen Leistung und Zugänglichkeit und zeichnet sich in Benchmarks wie AIME 2024 und SWE-bench Verified aus.

Häufig gestellte Fragen

Was sind die wichtigsten Funktionen von DeepSeek R1 Distill Qwen 32B?

Mehrsprachige Unterstützung für 29+ Sprachen.
Verarbeitet lange Texte (8K+ Tokens) und strukturierte Daten wie JSON.
Unterstützt Text-zu-Text-Transformationen und fortgeschrittene Rollenspielszenarien.

Welche Benchmarks heben seine Leistung hervor?

AIME 2024: 72,6% Genauigkeit (übertrifft OpenAI-o1-mini).
SWE-bench Verified: 49,2% Genauigkeit (vor Llama-70B).
Konsequente Leistung in anderen Benchmarks wie MATH-500 und MMLU.

Was sind die Hardware-Anforderungen?

Modellgröße: 73,21 GB.
Empfohlene GPUs: 1 × H100 (80GB) oder A100 (80GB).
2 × L40s (96GB) oder 4 × RTX 4090 (96GB).

Novita AI ist die All-in-One-Cloud-Plattform, die Ihre KI-Ambitionen unterstützt. Integrierte APIs, serverlos, GPU-Instanz — die kostengünstigen Tools, die Sie benötigen. Verzichten Sie auf Infrastruktur, starten Sie kostenlos und machen Sie Ihre KI-Vision zur Realität.

Deepseek R1 Distill Qwen 32B Zugangsanleitung: Lokal oder API?

Wichtige Highlights

Deepseek R1 Distill Qwen 32B Grundlegende Einführung

Basisinformationen

Modellgröße

Open Source

Architektur

Sprachunterstützung

Wichtige Highlights

Multimodale Fähigkeiten

Training

Benchmark

So greifen Sie lokal auf Deepseek R1 Distill Qwen 32B zu

Hardware-Anforderungen

Schritt-für-Schritt-Installationsanleitung

Herausforderungen bei der lokalen Bereitstellung

So greifen Sie über Novita AI auf Deepseek R1 Distill Qwen 32B zu

Schritt 1: Anmelden und auf die Modellbibliothek zugreifen

Schritt 2: Wählen Sie Ihr Modell

Schritt 3: Starten Sie Ihre kostenlose Testversion

Schritt 4: Holen Sie sich Ihren API-Schlüssel

Schritt 5: Installieren Sie die API

Welche Methoden sind für Sie geeignet?

Häufig gestellte Fragen

Empfohlene Lektüre

Product

RESOURCES

Partners

Company

Wichtige Highlights

Deepseek R1 Distill Qwen 32B Grundlegende Einführung

Basisinformationen

Modellgröße

Open Source

Architektur

Sprachunterstützung

Wichtige Highlights

Multimodale Fähigkeiten

Training

Benchmark

So greifen Sie lokal auf Deepseek R1 Distill Qwen 32B zu

Hardware-Anforderungen

Schritt-für-Schritt-Installationsanleitung

Herausforderungen bei der lokalen Bereitstellung

So greifen Sie über Novita AI auf Deepseek R1 Distill Qwen 32B zu

Schritt 1: Anmelden und auf die Modellbibliothek zugreifen

Schritt 2: Wählen Sie Ihr Modell

Schritt 3: Starten Sie Ihre kostenlose Testversion

Schritt 4: Holen Sie sich Ihren API-Schlüssel

Schritt 5: Installieren Sie die API

Welche Methoden sind für Sie geeignet?

Häufig gestellte Fragen

Empfohlene Lektüre

Ähnliche Beiträge

Product

RESOURCES

Partners

Company