So stellen Sie DeepSeek-R1-0528-Qwen3-8B auf Novita AI GPU-Instanzen bereit

So stellen Sie DeepSeek-R1-0528-Qwen3-8B auf Novita AI GPU-Instanzen bereit

Stellen Sie sich vor, Sie könnten ein 8B-Parameter-Modell ausführen, das Modelle mit der 30-fachen Größe übertrifft.

DeepSeek-R1-0528-Qwen3-8B liefert bahnbrechende Reasoning-Leistung, die mit 235B-Parameter-Modellen bei komplexen mathematischen Aufgaben mithalten kann – und das effizient auf einer einzigen RTX 4090.

Diese Anleitung zeigt Ihnen, wie Sie dieses wegweisende Modell in wenigen Minuten auf Novita AI bereitstellen.

Was ist DeepSeek-R1-0528-Qwen3-8B?

DeepSeek-R1-0528-Qwen3-8B ist ein hochentwickeltes Reasoning-Modell, das durch Destillation der Chain-of-Thought-Fähigkeiten von DeepSeek-R1-0528 in das Qwen3 8B Base-Modell entstanden ist. Dieser innovative Ansatz hat ein hochmodernes Open-Source-Modell hervorgebracht, das bei mathematischen und logischen Benchmarks bemerkenswerte Ergebnisse erzielt – unter anderem beim AIME 2024 übertrifft es Qwen3 8B um +10,0 % und erreicht die Leistung des wesentlich größeren Qwen3-235B-thinking-Modells.

Das Modell zeigt außergewöhnliche Fähigkeiten in verschiedenen Bewertungsmetriken: 86,0 bei AIME 24, 76,3 bei AIME 25 und 61,5 bei HMMT Feb 25. Was dieses Modell besonders wertvoll macht, ist seine Fähigkeit, Reasoning-Leistung zu liefern, die mit wesentlich größeren Modellen vergleichbar ist, während es die Effizienz und Einsetzbarkeit eines 8B-Parameter-Modells beibehält.

DeepSeek-R1-0528-Qwen3-8B Benchmark

Warum DeepSeek-R1-0528-Qwen3-8B auf Novita AI GPU-Instanzen ausführen?

1. Deutlicher Preisvorteil und flexible Preismodelle

Novita AI bietet wettbewerbsfähige Preise auf dem Markt für GPU-Computing und macht fortschrittliche KI-Modelle wie DeepSeek-R1-0528-Qwen3-8B für Forscher, Unternehmen und Entwickler jeder Größenordnung zugänglich.

Wählen Sie zwischen On-Demand- und Abonnement-Preisen basierend auf Ihren Nutzungsmustern. Für DeepSeek-R1-0528-Qwen3-8B auf einer RTX 4090:

  • On-Demand: 0,35 $/Stunde – geeignet für Tests und variable Arbeitslasten
  • 1–5 Monate: 226,80 $/Monat (10 % Rabatt) – mittelfristige Projekte
  • 6–11 Monate: 206,64 $/Monat (18 % Rabatt) – längere Entwicklungszyklen
  • 12 Monate: 189,00 $/Monat (25 % Rabatt) – größere Ersparnisse bei langfristigen Verpflichtungen

Das Jahresabonnement kann Ihnen Hunderte von Dollar sparen und bietet gleichzeitig garantierte Ressourcenverfügbarkeit. Erfahren Sie mehr über Preismodelle.

2. Mehrere GPU-Optionen zur Leistungsoptimierung

Novita AI bietet umfassende GPU-Optionen, die Ihren Rechenanforderungen und Ihrem Budget entsprechen:

  • RTX 3090 24GB: kostengünstig für Entwicklung und Tests
  • RTX 4090 24GB: Empfohlen für DeepSeek-R1-0528-Qwen3-8B – ausgewogene Leistung und Kosten
  • RTX 5090 32GB
  • RTX 6000 Ada 48GB: Erweiterter VRAM für größere Kontextlängen
  • L40S 48GB: Profi-Leistung mit erweiterter Speicherkapazität
  • A100 SXM 80GB: Hochleistungsrechnen mit beträchtlicher Speicherbandbreite
  • H100 SXM 80GB: Enterprise-Leistung für Produktionseinsätze

3. Fertig konfigurierte Vorlagen und individuelle Flexibilität

Vorkonfigurierte Vorlagen für beliebte Modelle wie DeepSeek-R1-0528-Qwen3-8B eliminieren die Komplexität der manuellen Einrichtung und enthalten optimierte Container-Konfigurationen, Umgebungsvariablen und getestete Bereitstellungsparameter. Fortgeschrittene Benutzer können vollständig benutzerdefinierte Vorlagen erstellen mit speziellen Konfigurationen und personalisierten Bereitstellungsskripten – das gewährleistet sowohl einfache Handhabung für Einsteiger als auch umfassende Anpassungsmöglichkeiten für erfahrene Entwickler.

4. Globales Bereitstellungsnetzwerk

Stellen Sie GPU-Instanzen näher an Ihren Benutzern bereit, und zwar über das weltweite Netzwerk von Novita AI mit 15 Regionen in Amerika (USA, Kanada, Brasilien), Asien-Pazifik (Japan, Singapur, Indien, VAE, Hongkong) und Europa (Deutschland, Großbritannien). Diese globale Infrastruktur sorgt für geringe Latenz und zuverlässige Leistung Ihrer DeepSeek-R1-0528-Qwen3-8B-Bereitstellung und bietet unabhängig vom Standort des Benutzers zuverlässigen Zugriff.

So stellen Sie DeepSeek-R1-0528-Qwen3-8B auf Novita AI bereit

Schritt 1: Vorlagenauswahl

Wählen Sie die Vorlage DeepSeek-R1-0528-Qwen3-8B aus der Modellbibliothek. Wählen Sie eine RTX 4090 als GPU-Typ und klicken Sie auf Bereitstellen.

RTX 4090 auswählen

Schritt 2: Parameter bestätigen

Überprüfen Sie die auf dem Konfigurationsbildschirm angezeigten Bereitstellungsparameter. Vergewissern Sie sich, dass alle Einstellungen korrekt sind, und klicken Sie auf Weiter, um fortzufahren.

Vorlage verwenden

Schritt 3: Instanz bereitstellen

Klicken Sie auf Bereitstellen, um den Erstellungsprozess der Instanz zu starten. Das System beginnt mit der Bereitstellung Ihrer GPU-Instanz.

Vorlage bereitstellen

Schritt 4: Bereitstellungsfortschritt überwachen

Navigieren Sie zu Instanzverwaltung, um die Verwaltungskonsole aufzurufen. Dieses Dashboard ermöglicht es Ihnen, den Bereitstellungsstatus in Echtzeit zu verfolgen.

Schritt 5: Status des Image-Pullings anzeigen

Klicken Sie auf Ihre spezifische Instanz, um den Fortschritt des Container-Image-Downloads zu überwachen. Dieser Vorgang kann je nach Netzwerkbedingungen einige Minuten dauern.

Schritt 6: Modell-Download verfolgen

Nachdem die Instanz gestartet ist, beginnt sie mit dem Herunterladen des Modells. Klicken Sie auf „Logs“„Instanz-Logs“, um den Fortschritt des Modell-Downloads zu überwachen.

Schritt 7: Erfolgreiche Bereitstellung bestätigen

Suchen Sie in den Instanz-Logs nach der Meldung "Application startup complete.". Diese zeigt an, dass der Bereitstellungsprozess erfolgreich abgeschlossen wurde.

Schritt 8: Zugriffs-URL abrufen

Klicken Sie auf „Verbinden“ und dann auf → „Mit HTTP-Dienst verbinden [Port 8000]“. Da es sich um einen API-Dienst handelt, müssen Sie die Adresse kopieren.

Website-URL

Schritt 9: Auf Ihr bereitgestelltes Modell zugreifen

Um Anfragen an Ihr Modell zu stellen, ersetzen Sie bitte http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai durch Ihre tatsächliche öffentliche Adresse. Kopieren Sie den folgenden Code, um auf Ihr privates Modell zuzugreifen!

# Aufruf des Servers mit curl:
curl -X POST "http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai/v1/chat/completions" \
        -H "Content-Type: application/json" \
        --data '{
                "model": "deepseek-ai/DeepSeek-R1-0528-Qwen3-8B",
                "messages": [
                        {
                                "role": "user",
                                "content": "What is the capital of France?"
                        }
                ]
        }'
{"id":"chatcmpl-56d12c91edbb46fcb93ccbbc0ecddd2c","object":"chat.completion","created":1748588145,"model":"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B","choices":[{"index":0,"message":{"role":"assistant","reasoning_content":null,"content":" thinking\
Okay, the user is asking for the capital of France. Let me start by recalling the basic answer. Paris is definitely the correct response, so I'll start with that.\
\
But why is the user asking this? They might be a student preparing for a test, or maybe someone traveling who needs to know the main city for planning. Alternatively, they could be testing my knowledge. But since it's a straightforward question, I'll focus on providing accurate information.\
\
Wait, maybe they need more context. Should I mention some points of interest to add value? Like Eiffel Tower or Louvre. That could help if they're interested in tourism or education. \
\
I should check if there's any recent political changes or administrative updates but nothing seems off with Paris' status as a capital. Alright, keep it simple but informative. Let me structure the answer first, then decide on the optional details. \
\
Also, considering the user might not want a long answer. But including key landmarks might make it more engaging. They didn't ask for historical info, so maybe just stick to the status and one or two unique facts. \
\
Yes, \"city of love\" is a common nickname, so that adds a nice touch. Alright, final answer will confirm Paris, mention the nicknames, and list two landmarks to cover possible interests without being overwhelming.\
 response\
The capital of France is **Paris**.","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":294,"completion_tokens":284,"prompt_tokens_details":null},"prompt_logprobs":null}

Konfigurieren Sie die API-Adresse in Ihren Anwendungen wie Chatbox, und Sie haben Ihren eigenen persönlichen Assistenten!

Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle mit unserer einfachen API bereitzustellen und gleichzeitig eine erschwingliche und zuverlässige GPU-Cloud zum Aufbau und zur Skalierung bereitzustellen.