English Arabic 简体中文 繁體中文 Français Deutsch 日本語 한국어 Português Русский Español

So greifen Sie lokal oder über die API auf DeepSeek R1 zu: Ein vollständiger Leitfaden

So greifen Sie lokal oder über die API auf DeepSeek R1 zu: Ein vollständiger Leitfaden

Hauptvorteile

1. Fortschrittliche Leistung
Überlegene Schlussfolgerungsfähigkeit: Dominant bei Benchmarks für Mathematik (AIME 2024, MATH-500) und Programmierung (Codeforces).
Architektur: MoE + RL-optimiertes Training mit 671B Parametern (37B aktiv/Token).

2. Lokaler Zugriff über Ollama
Ollama installieren; ollama run deepseek-r1:7b ausführen, um das Modell herunterzuladen; mit ollama list überprüfen und über das Terminal interagieren.

3. Herausforderungen der lokalen Bereitstellung
Hardware: Erfordert High-End-GPUs (z. B. H800) mit 24 GB+ VRAM.
Speicher: 671B Parameter verlangsamen das Laden; Risiko von Disk-Swapping.
Einrichtung: Manuelle Installation von Gewichten, Bibliotheken und Konfiguration.
Destillierte Modelle: Kleinere Versionen (z. B. Qwen-32B) reduzieren den Ressourcenbedarf, beeinträchtigen jedoch die Leistung.

4. API-Zugriff: Novita AI bietet eine API für DeepSeek R1. Melden Sie sich für eine kostenlose Testversion an und verwenden Sie die API mit einfachen Anfragen.

DeepSeek R1 ist ein hochmodernes KI-Modell, das für seine starken Schlussfolgerungsfähigkeiten bekannt ist, insbesondere in Mathematik und Programmierung. Dieser Artikel führt Sie durch die verschiedenen Möglichkeiten, wie Sie auf DeepSeek R1 zugreifen können – entweder durch lokale Ausführung oder durch die Nutzung einer API.

Was ist DeepSeek R1?

  • Veröffentlichungsdatum: 21. Januar 2025
  • Modellgröße:
  • Hauptmerkmale:
    • Modellgröße: 671B Parameter (37B aktiv/Token)
    • Tokenizer: Verbesserter Tokenizer mit Selbstreflexions-Tags
    • Unterstützte Sprachen: Mehrsprachig mit kultureller Anpassung
    • Multimodal: Nur Text
    • Kontextfenster: 128K Token
    • Speicherformate: Q8/Q5-Quantisierungsunterstützung
    • Architektur: Mixture of Experts (MoE) + RL-optimierte Trainingspipeline
    • Trainingsmethode: Auf V3-Basis mit RL-Pipeline (SFT → RL → SFT → RL)
    • Trainingsdaten: V3-Basis + RL-Optimierungsdaten

https://www.youtube.com/watch?v=ApvcIYDgXzg

Benchmark-Vergleich

DeepSeek-R1 zeigt in den meisten Tests eine überlegene Leistung, insbesondere bei Aufgaben, die hohe Genauigkeit und komplexes Schlussfolgern erfordern (wie AIME 2024, Codeforces, MATH-500 und MMLU). Es übertrifft Modelle wie OpenAI-o1-1217 und OpenAI-o1-mini in diesen Bereichen. Allerdings zeigt DeepSeek-R1 bei spezifischen Aufgaben wie GPQA Diamond und SWE-bench Verified eine schwächere Leistung, was auf potenzielle Verbesserungsbereiche im Vergleich zu Modellen wie Open AI O1 hinweist.

Anwendungen

  • Lösen mathematischer Probleme und Codegenerierung.
  • Komplexe logische Schlussfolgerungsaufgaben.
  • Unterstützung bei der Diagnose komplexer Probleme.
  • Analyse von mehrstufigen Szenarien.
  • Synthese von Erkenntnissen aus großen Datensätzen.
  • Kundendienstanwendungen.

So greifen Sie lokal auf DeepSeek R1 zu

https://www.youtube.com/watch?v=pbCQnDDj-bo

Schritt-für-Schritt-Installationsanleitung

1. Ollama installieren

  • Besuchen Sie die Ollama-Website, laden Sie die Version für Ihr Betriebssystem herunter und installieren Sie sie.

2. DeepSeek-R1-Modell herunterladen

  • Öffnen Sie Ihr Terminal und führen Sie (am Beispiel der 7B-Parameter-Version) aus: bashCopyollama run deepseek-r1:7b (Warten Sie, bis der Download abgeschlossen ist; die Zeit hängt von Ihrer Netzwerkgeschwindigkeit ab.)
ollama run deepseek-r1:7b

3. Überprüfen und Ausführen

  • Installation überprüfen:
ollama list  # Prüfen, ob "deepseek-r1" in der Liste erscheint
  • Modell starten:
ollama run deepseek-r1:7b

4. Nutzungsbeispiele

  • Eine Frage stellen: bashCopy>>> "Erklären Sie Quantencomputing in einfachen Worten."
  • Code generieren: bashCopy>>> "Schreiben Sie eine Python-Funktion zur Berechnung der Fibonacci-Folge."

Herausforderungen bei der lokalen Bereitstellung

1. Hardware-Einschränkungen

  • Hohe Ressourcenanforderungen:
    • Erfordert High-End-GPUs/TPUs (z. B. H800) mit erheblichem VRAM/RAM.
  • Speicherbeschränkungen:
    • 671B Parameter (37B aktiviert pro Token) führen zu langsamem Laden.
    • Unzureichender VRAM/RAM verursacht Disk-Swapping oder Fehlschläge.

2. Einrichtung und Konfiguration

  • Komplexe Installation:
    • Manuelle Schritte: Herunterladen der Modellgewichte (Hugging Face), Installieren von Bibliotheken (z. B. transformers), Konfigurieren von Frameworks.
    • Erfordert technisches Fachwissen für Optimierungen.
  • Softwareoptimierung:
    • Muss Antworten mit \denken`` erzwingen, um korrekte Denkmuster sicherzustellen.

3. Leistungsengpässe

  • Langsame Inferenz:
    • CPU/GPU-Begrenzungen und Speicherbandbreite reduzieren die Verarbeitungsgeschwindigkeit.
  • Wartungsaufwand:
    • Manuelle Updates für neue Modellversionen erfordern kontinuierlichen Aufwand.

4. Kompromisse bei destillierten Modellen

  • Reduzierter Ressourcenbedarf:
    • Kleinere Versionen (z. B. Qwen-32B, Llama-70B) senken die Hardwareanforderungen.
    • Beispiel: Qwen-32B übertrifft OpenAI-o1-mini in Benchmarks.
  • Leistungsnachteile:
    • Verlust an Genauigkeit oder Fähigkeiten im Vergleich zum vollständigen 671B-Modell.
    • Können bei komplexen Aufgaben, die tiefes Schlussfolgern erfordern, Schwierigkeiten haben.
Für volle Leistungsfähigkeit: Entscheiden Sie sich für den API-Zugriff, um Hardware- und Einrichtungsprobleme zu vermeiden.

So greifen Sie über Novita AI auf DeepSeek R1 zu

Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen und gleichzeitig eine kostengünstige und zuverlässige GPU-Cloud zum Aufbau und zur Skalierung bereitstellt.

Schritt 1: Einloggen und auf die Modellbibliothek zugreifen

Loggen Sie sich in Ihr Konto ein und klicken Sie auf die Schaltfläche Modellbibliothek.

Einloggen und auf die Modellbibliothek zugreifen

Jetzt DeepSeek R1 Demo testen!

Schritt 2: Wählen Sie Ihr Modell

Durchsuchen Sie die verfügbaren Optionen und wählen Sie das Modell aus, das Ihren Anforderungen entspricht.

modelle auswählen

Schritt 3: Kostenlose Testversion starten

Starten Sie Ihre kostenlose Testversion, um die Fähigkeiten des ausgewählten Modells zu erkunden.

kostenlose testversion auf r1 starten

Schritt 4: API-Schlüssel abrufen

Zur Authentifizierung mit der API erhalten Sie einen neuen API-Schlüssel. Gehen Sie auf die Seite „Einstellungen“ und kopieren Sie den API-Schlüssel wie im Bild angegeben.

api-schlüssel abrufen

Schritt 5: API installieren

Installieren Sie die API mit dem Paketmanager, der für Ihre Programmiersprache geeignet ist.

api installieren

Importieren Sie nach der Installation die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit Novita AI LLM zu interagieren. Dies ist ein Beispiel für die Verwendung der Chat-Completions-API für Python-Benutzer.

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=&#91;
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices&#91;0].delta.content or "", end="")
else:
    print(chat_completion_res.choices&#91;0].message.content)

Nach der Registrierung stellt Novita AI ein Guthaben von 0,50 $ zur Verfügung, damit Sie loslegen können!

Wenn das kostenlose Guthaben aufgebraucht ist, können Sie bezahlen, um es weiter zu nutzen.

Welche Methoden sind für Sie geeignet?

  • Forscher: Lokaler Zugriff wird im Allgemeinen bevorzugt, da er Flexibilität und Kontrolle über Experimente bietet.

  • Entwickler:

    • API-Zugriff eignet sich für die Entwicklung von Anwendungen und schnelles Prototyping.
    • Lokaler Zugriff ist besser für Feintuning und benutzerdefinierte Workflows.
  • Unternehmen: API-Zugriff ist vorteilhaft für die schnelle Integration in Dienste ohne hohe Anschaffungskosten. Lokale Bereitstellung kann für Teams mit konsistenten Anforderungen und der Möglichkeit, in Infrastruktur zu investieren, geeignet sein.

  • Kleine Teams / Einzelpersonen: API-Zugriff ist aufgrund der geringeren Startkosten in der Regel praktischer.

  • Benutzer mit geringen technischen Kenntnissen: API-Zugriff ist vorzuziehen, da er kein tiefes technisches Wissen erfordert.

Zusammenfassend ist DeepSeek R1 ein beeindruckendes Modell mit hochmodernen Schlussfolgerungsfähigkeiten. Unabhängig davon, ob Sie es lokal ausführen oder eine API verwenden, müssen Sie die Kompromisse zwischen Kontrolle, Kosten und Bequemlichkeit abwägen. Durch sorgfältige Abwägung dieser Faktoren und der spezifischen Empfehlungen in diesem Artikel können Sie die beste Zugriffsmethode für Ihre Ziele wählen.

Häufig gestellte Fragen

Ist DeepSeek R1 besser als OpenAI o1?

DeepSeek R1 bietet eine vergleichbare Leistung, insbesondere bei Schlussfolgerungsaufgaben, mit dem zusätzlichen Vorteil, dass es Open Source und kostengünstiger ist.

Wie kann ich DeepSeek R1 verfeinern?

Als Open-Source-Modell kann DeepSeek R1 für bestimmte Aufgaben verfeinert werden, sofern Sie über die nötigen Rechenressourcen und Daten verfügen.

Wie werden die Modelle trainiert?

DeepSeek R1 ist deutlich günstiger als die Modelle von OpenAI o1.

Novita AI ist die All-in-One-Cloud-Plattform, die Ihre KI-Ambitionen unterstützt. Integrierte APIs, Serverless, GPU-Instanzen – die kostengünstigen Tools, die Sie benötigen. Infrastruktur eliminieren, kostenlos starten und Ihre KI-Vision verwirklichen.

Empfohlene Lektüre