DeepSeek-R1-0528 und DeepSeek-R1-0528-Qwen3-8B jetzt auf Novita AI verfügbar

DeepSeek-R1-0528 und DeepSeek-R1-0528-Qwen3-8B jetzt auf Novita AI verfügbar

DeepSeek hat zwei bahnbrechende Modelle veröffentlicht – DeepSeek-R1-0528 und DeepSeek-R1-0528-Qwen3-8B – beide jetzt verfügbar auf Novita AI, einer KI-Cloud-Plattform, die Entwicklern eine einfache Bereitstellung von KI-Modellen über unsere unkomplizierte API bietet. Diese Modelle liefern außergewöhnliche Reasoning-Fähigkeiten zu wettbewerbsfähigen Preisen und übertreffen ihre Vorgänger deutlich.

Novita AI bietet beide DeepSeek-R1-0528-Modelle zu wettbewerbsfähigen Tarifen mit transparentem Pay-per-Use-Preismodell an:

DeepSeek-R1-0528 (Vollmodell):

  • Eingabe-Token: 0,70 $ pro Million Token
  • Ausgabe-Token: 2,50 $ pro Million Token

DeepSeek-R1-0528-Qwen3-8B (Effizientes 8B-Modell):

  • Eingabe-Token: 0,06 $ pro Million Token
  • Ausgabe-Token: 0,09 $ pro Million Token

DeepSeek-R1-0528 Demo testen

Was ist DeepSeek-R1-0528?

Das DeepSeek R1 Modell hat ein Minor-Update erfahren, die aktuelle Version ist DeepSeek-R1-0528. In diesem neuesten Update hat DeepSeek R1 seine Reasoning-Tiefe und Inferenzfähigkeiten durch den Einsatz erhöhter Rechenressourcen und die Einführung algorithmischer Optimierungsmechanismen während des Post-Trainings deutlich verbessert.

Das Modell zeigt herausragende Leistungen in verschiedenen Benchmark-Auswertungen, darunter Mathematik, Programmierung und allgemeine Logik. Die Gesamtleistung nähert sich nun der führender Modelle wie O3 und Gemini 2.5 Pro an.

Wichtige Verbesserungen von DeepSeek-R1-0528

🔹 Verbesserte Benchmark-Ergebnisse bei Mathematik, Programmierung und Reasoning-Aufgaben
🔹 Verbesserte Frontend-Funktionen für ein besseres Benutzererlebnis
🔹 Reduzierte Halluzinationen für zuverlässigere Ausgaben
🔹 Unterstützt JSON-Ausgabe & Funktionsaufrufe für nahtlose Integration

Erhöhte Reasoning-Tiefe

Im Vergleich zur Vorgängerversion zeigt das aktualisierte Modell deutliche Verbesserungen bei der Verarbeitung komplexer Reasoning-Aufgaben. So stieg die Genauigkeit des Modells im AIME-2025-Test von 70 % in der vorherigen Version auf 87,5 % in der aktuellen Version.

Dieser Fortschritt resultiert aus einer erhöhten Denktiefe während des Reasoning-Prozesses: Im AIME-Testsatz verwendete das vorherige Modell durchschnittlich 12.000 Token pro Frage, während die neue Version durchschnittlich 23.000 Token pro Frage benötigt.

Wettbewerbsfähige Leistung im Vergleich zu Branchenführern

DeepSeek-R1-0528 zeigt bemerkenswerte Leistungen im Vergleich zu branchenführenden Modellen in verschiedenen anspruchsvollen Benchmarks:

deepseek r1 0528 benchmark

DeepSeek-R1 vs. DeepSeek-R1-0528

Mathematische Reasoning-Leistung

Benchmark DeepSeek R1 DeepSeek R1-0528 Verbesserung
AIME 2024 (Pass@1) 79,8 91,4 +11,6
AIME 2025 (Pass@1) 70,0 87,5 +17,5
HMMT 2025 (Pass@1) 41,7 79,4 +37,7
CNMO 2024 (Pass@1) 78,8 86,9 +8,1

Verbesserung der Programmierleistung

Benchmark DeepSeek R1 DeepSeek R1-0528 Verbesserung
LiveCodeBench (Pass@1) 63,5 73,3 +9,8
Codeforces-Div1 (Rating) 1530 1930 +400
SWE Verified (Gelöst) 49,2 57,6 +8,4
Aider-Polyglot (Genauigkeit) 53,3 71,6 +18,3

Allgemeine Reasoning-Aufgaben

Benchmark DeepSeek R1 DeepSeek R1-0528 Verbesserung
MMLU-Redux (EM) 92,9 93,4 +0,5
MMLU-Pro (EM) 84,0 85,0 +1,0
GPQA-Diamond (Pass@1) 71,5 81,0 +9,5
SimpleQA (Richtig) 30,1 27,8 -2,3
FRAMES (Genauigkeit) 82,5 83,0 +0,5
Humanity’s Last Exam (Pass@1) 8,5 17,7 +9,2

Neue Fähigkeiten zur Tool-Integration

DeepSeek-R1-0528 führt erweiterte Fähigkeiten für Funktionsaufrufe und Tool-Integration ein:

  • BFCL_v3_MultiTurn (Genauigkeit): 37,0 %
  • Tau-Bench (Pass@1): 53,5 % (Airline) / 63,9 % (Retail)

DeepSeek-R1-0528-Qwen3-8B: Kompakte Exzellenz

DeepSeek destillierte das Chain-of-Thought-Reasoning von DeepSeek-R1-0528, um DeepSeek-R1-0528-Qwen3-8B aus Qwen3 8B Base zu erstellen. Dieses Modell erzielt bei AIME 2024 eine State-of-the-Art (SOTA)-Leistung unter den Open-Source-Modellen und übertrifft Qwen3-8B um +10,0 %, während es die Leistung von Qwen3-235B-thinking erreicht.

Dies zeigt, dass das Chain-of-Thought-Reasoning von DeepSeek-R1-0528 sowohl für die akademische Forschung an Reasoning-Modellen als auch für die industrielle Entwicklung kleiner Modelle von großer Bedeutung ist.

Wettbewerbsanalyse mit führenden Modellen

Modell AIME 24 AIME 25 HMMT Feb 25 GPQA Diamond LiveCodeBench
Qwen3-235B-A22B 85,7 81,5 62,5 71,1 66,5
Qwen3-32B 81,4 72,9 - 68,4 -
Qwen3-8B 76,0 67,3 - 62,0 -
Phi-4-Reasoning-Plus-14B 81,3 78,0 53,6 69,3 -
Gemini-2.5-Flash-Thinking-0520 82,3 72,0 64,2 82,8 62,3
o3-mini (medium) 79,6 76,7 53,3 76,8 65,9
DeepSeek-R1-0528-Qwen3-8B 86,0 76,3 61,5 61,1 60,5

Nutzungsverbesserungen und technische Details

Verbesserte Benutzerfreundlichkeit

Im Vergleich zu früheren Versionen von DeepSeek-R1 umfassen die Nutzungsempfehlungen für DeepSeek-R1-0528 die folgenden Verbesserungen:

  • System-Prompt-Unterstützung: Im Gegensatz zu früheren Versionen können Sie jetzt System-Prompts verwenden, um einen konsistenten Kontext und Anweisungen bereitzustellen.
  • Automatisches Denkmuster: Keine manuelle Aktivierung erforderlich – das Modell aktiviert automatisch seine Reasoning-Fähigkeiten, ohne dass am Anfang der Ausgaben " thinking\ " stehen muss.

DeepSeek-R1-0528-Qwen3-8B-Architektur

Die Modellarchitektur von DeepSeek-R1-0528-Qwen3-8B ist identisch mit der von Qwen3-8B, verwendet jedoch die gleiche Tokenizer-Konfiguration wie DeepSeek-R1-0528. Dieses Modell kann auf die gleiche Weise wie Qwen3-8B ausgeführt werden, aber stellen Sie sicher, dass alle Konfigurationsdateien aus dem DeepSeek-Repository stammen, nicht aus dem ursprünglichen Qwen3-Projekt.

Warum Entwickler Novita AI wählen

Vereinfachte Bereitstellung von KI-Modellen

  • Keine Infrastruktur-Probleme: Konzentrieren Sie sich auf die Entwicklung von Anwendungen, nicht auf die Verwaltung von Servern.
  • Sofortiger Modellzugriff: Stellen Sie hochmoderne Modelle mit einem einzigen API-Aufruf bereit.
  • Zuverlässige Leistung: Unternehmensinfrastruktur mit 99,9 % Verfügbarkeit.
  • Globale Verfügbarkeit: Geringe Latenz von überall auf der Welt.

Perfekt für jede Größenordnung

  • Schnelles Prototyping: Testen Sie Ideen schnell mit sofortigem Modellzugriff.
  • Produktionsreif: Skalieren Sie nahtlos vom Prototyp zur Produktion.
  • Kosteneffizient: Bezahlen Sie nur, was Sie nutzen, mit transparenten Preisen.
  • Enterprise-Support: Dedizierter Support für Anwendungen mit hohem Volumen.

Ideale Anwendungsfälle

  • Mathematische KI-Anwendungen: Erstellen Sie Lernplattformen mit 87,5 % Genauigkeit bei AIME 2025.
  • Code-Generierungstools: Entwickeln Sie Entwicklungsassistenten mit 73,3 % Erfolgsquote bei LiveCodeBench.
  • Forschungsplattformen: Stellen Sie Reasoning-Modelle bereit, die mit Branchenführern konkurrieren.
  • Bildungssoftware: Entwickeln Sie schrittweise Problemlösungsanwendungen.

Erste Schritte auf Novita AI

  1. Registrieren Sie sich in Sekundenschnelle bei Novita AI und sichern Sie sich 10 $ Gratisguthaben
  2. Erkunden Sie DeepSeek-R1-0528 (volle Fähigkeiten) oder DeepSeek-R1-0528-Qwen3-8B (effizient)
  3. Holen Sie sich Ihren API-Schlüssel aus dem Dashboard
  4. Tätigen Sie Ihren ersten API-Aufruf über unsere OpenAI-kompatiblen Endpunkte
  5. Beginnen Sie mit dem Bauen mit branchenführenden Reasoning-Fähigkeiten

Für Python-Benutzer:

from openai import OpenAI

base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"

client = OpenAI(
    base_url=base_url,
    api_key=api_key,
)

stream = True # or False
max_tokens = 1000

response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    extra_body={
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Fazit

Die Modelle der DeepSeek-R1-0528-Serie liefern branchenführende Leistungen zu wettbewerbsfähigen Preisen – mit 91,4 % bei AIME 2024 und 73,3 % bei LiveCodeBench, während sie mit OpenAI-o3 und Gemini-2.5-Pro konkurrieren.

Über die entwicklerfreundliche Plattform von Novita AI erhalten Sie sofortigen Zugriff auf diese hochmodernen Modelle ohne Infrastrukturkomplexität. Mit transparenten Preisen, 10 $ Gratisguthaben und unserer intuitiven API war die Integration weltklassiger Reasoning-Fähigkeiten in Ihre Anwendungen noch nie einfacher.

Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen, und gleichzeitig eine erschwingliche und zuverlässige GPU-Cloud zum Aufbau und zur Skalierung bereitstellt.