DeepSeek-R1-0528 und DeepSeek-R1-0528-Qwen3-8B jetzt auf Novita AI verfügbar

Inhaltsverzeichnis

Was ist DeepSeek-R1-0528?
DeepSeek-R1 vs. DeepSeek-R1-0528
DeepSeek-R1-0528-Qwen3-8B: Kompakte Exzellenz
Nutzungsverbesserungen und technische Details
Warum Entwickler Novita AI wählen
Erste Schritte auf Novita AI
Fazit

DeepSeek hat zwei bahnbrechende Modelle veröffentlicht – DeepSeek-R1-0528 und DeepSeek-R1-0528-Qwen3-8B – beide jetzt verfügbar auf Novita AI, einer KI-Cloud-Plattform, die Entwicklern eine einfache Bereitstellung von KI-Modellen über unsere unkomplizierte API bietet. Diese Modelle liefern außergewöhnliche Reasoning-Fähigkeiten zu wettbewerbsfähigen Preisen und übertreffen ihre Vorgänger deutlich.

Novita AI bietet beide DeepSeek-R1-0528-Modelle zu wettbewerbsfähigen Tarifen mit transparentem Pay-per-Use-Preismodell an:

DeepSeek-R1-0528 (Vollmodell):

Eingabe-Token: 0,70 $ pro Million Token
Ausgabe-Token: 2,50 $ pro Million Token

DeepSeek-R1-0528-Qwen3-8B (Effizientes 8B-Modell):

Eingabe-Token: 0,06 $ pro Million Token
Ausgabe-Token: 0,09 $ pro Million Token

DeepSeek-R1-0528 Demo testen

Was ist DeepSeek-R1-0528?

Das DeepSeek R1 Modell hat ein Minor-Update erfahren, die aktuelle Version ist DeepSeek-R1-0528. In diesem neuesten Update hat DeepSeek R1 seine Reasoning-Tiefe und Inferenzfähigkeiten durch den Einsatz erhöhter Rechenressourcen und die Einführung algorithmischer Optimierungsmechanismen während des Post-Trainings deutlich verbessert.

Das Modell zeigt herausragende Leistungen in verschiedenen Benchmark-Auswertungen, darunter Mathematik, Programmierung und allgemeine Logik. Die Gesamtleistung nähert sich nun der führender Modelle wie O3 und Gemini 2.5 Pro an.

Wichtige Verbesserungen von DeepSeek-R1-0528

🔹 Verbesserte Benchmark-Ergebnisse bei Mathematik, Programmierung und Reasoning-Aufgaben
🔹 Verbesserte Frontend-Funktionen für ein besseres Benutzererlebnis
🔹 Reduzierte Halluzinationen für zuverlässigere Ausgaben
🔹 Unterstützt JSON-Ausgabe & Funktionsaufrufe für nahtlose Integration

Erhöhte Reasoning-Tiefe

Im Vergleich zur Vorgängerversion zeigt das aktualisierte Modell deutliche Verbesserungen bei der Verarbeitung komplexer Reasoning-Aufgaben. So stieg die Genauigkeit des Modells im AIME-2025-Test von 70 % in der vorherigen Version auf 87,5 % in der aktuellen Version.

Dieser Fortschritt resultiert aus einer erhöhten Denktiefe während des Reasoning-Prozesses: Im AIME-Testsatz verwendete das vorherige Modell durchschnittlich 12.000 Token pro Frage, während die neue Version durchschnittlich 23.000 Token pro Frage benötigt.

Wettbewerbsfähige Leistung im Vergleich zu Branchenführern

DeepSeek-R1-0528 zeigt bemerkenswerte Leistungen im Vergleich zu branchenführenden Modellen in verschiedenen anspruchsvollen Benchmarks:

DeepSeek-R1 vs. DeepSeek-R1-0528

Mathematische Reasoning-Leistung

Benchmark	DeepSeek R1	DeepSeek R1-0528	Verbesserung
AIME 2024 (Pass@1)	79,8	91,4	+11,6
AIME 2025 (Pass@1)	70,0	87,5	+17,5
HMMT 2025 (Pass@1)	41,7	79,4	+37,7
CNMO 2024 (Pass@1)	78,8	86,9	+8,1

Verbesserung der Programmierleistung

Benchmark	DeepSeek R1	DeepSeek R1-0528	Verbesserung
LiveCodeBench (Pass@1)	63,5	73,3	+9,8
Codeforces-Div1 (Rating)	1530	1930	+400
SWE Verified (Gelöst)	49,2	57,6	+8,4
Aider-Polyglot (Genauigkeit)	53,3	71,6	+18,3

Allgemeine Reasoning-Aufgaben

Benchmark	DeepSeek R1	DeepSeek R1-0528	Verbesserung
MMLU-Redux (EM)	92,9	93,4	+0,5
MMLU-Pro (EM)	84,0	85,0	+1,0
GPQA-Diamond (Pass@1)	71,5	81,0	+9,5
SimpleQA (Richtig)	30,1	27,8	-2,3
FRAMES (Genauigkeit)	82,5	83,0	+0,5
Humanity’s Last Exam (Pass@1)	8,5	17,7	+9,2

Neue Fähigkeiten zur Tool-Integration

DeepSeek-R1-0528 führt erweiterte Fähigkeiten für Funktionsaufrufe und Tool-Integration ein:

BFCL_v3_MultiTurn (Genauigkeit): 37,0 %
Tau-Bench (Pass@1): 53,5 % (Airline) / 63,9 % (Retail)

DeepSeek-R1-0528-Qwen3-8B: Kompakte Exzellenz

DeepSeek destillierte das Chain-of-Thought-Reasoning von DeepSeek-R1-0528, um DeepSeek-R1-0528-Qwen3-8B aus Qwen3 8B Base zu erstellen. Dieses Modell erzielt bei AIME 2024 eine State-of-the-Art (SOTA)-Leistung unter den Open-Source-Modellen und übertrifft Qwen3-8B um +10,0 %, während es die Leistung von Qwen3-235B-thinking erreicht.

Dies zeigt, dass das Chain-of-Thought-Reasoning von DeepSeek-R1-0528 sowohl für die akademische Forschung an Reasoning-Modellen als auch für die industrielle Entwicklung kleiner Modelle von großer Bedeutung ist.

Wettbewerbsanalyse mit führenden Modellen

Modell	AIME 24	AIME 25	HMMT Feb 25	GPQA Diamond	LiveCodeBench
Qwen3-235B-A22B	85,7	81,5	62,5	71,1	66,5
Qwen3-32B	81,4	72,9	-	68,4	-
Qwen3-8B	76,0	67,3	-	62,0	-
Phi-4-Reasoning-Plus-14B	81,3	78,0	53,6	69,3	-
Gemini-2.5-Flash-Thinking-0520	82,3	72,0	64,2	82,8	62,3
o3-mini (medium)	79,6	76,7	53,3	76,8	65,9
DeepSeek-R1-0528-Qwen3-8B	86,0	76,3	61,5	61,1	60,5

Nutzungsverbesserungen und technische Details

Verbesserte Benutzerfreundlichkeit

Im Vergleich zu früheren Versionen von DeepSeek-R1 umfassen die Nutzungsempfehlungen für DeepSeek-R1-0528 die folgenden Verbesserungen:

System-Prompt-Unterstützung: Im Gegensatz zu früheren Versionen können Sie jetzt System-Prompts verwenden, um einen konsistenten Kontext und Anweisungen bereitzustellen.
Automatisches Denkmuster: Keine manuelle Aktivierung erforderlich – das Modell aktiviert automatisch seine Reasoning-Fähigkeiten, ohne dass am Anfang der Ausgaben " thinking\ " stehen muss.

DeepSeek-R1-0528-Qwen3-8B-Architektur

Die Modellarchitektur von DeepSeek-R1-0528-Qwen3-8B ist identisch mit der von Qwen3-8B, verwendet jedoch die gleiche Tokenizer-Konfiguration wie DeepSeek-R1-0528. Dieses Modell kann auf die gleiche Weise wie Qwen3-8B ausgeführt werden, aber stellen Sie sicher, dass alle Konfigurationsdateien aus dem DeepSeek-Repository stammen, nicht aus dem ursprünglichen Qwen3-Projekt.

Warum Entwickler Novita AI wählen

Vereinfachte Bereitstellung von KI-Modellen

Keine Infrastruktur-Probleme: Konzentrieren Sie sich auf die Entwicklung von Anwendungen, nicht auf die Verwaltung von Servern.
Sofortiger Modellzugriff: Stellen Sie hochmoderne Modelle mit einem einzigen API-Aufruf bereit.
Zuverlässige Leistung: Unternehmensinfrastruktur mit 99,9 % Verfügbarkeit.
Globale Verfügbarkeit: Geringe Latenz von überall auf der Welt.

Perfekt für jede Größenordnung

Schnelles Prototyping: Testen Sie Ideen schnell mit sofortigem Modellzugriff.
Produktionsreif: Skalieren Sie nahtlos vom Prototyp zur Produktion.
Kosteneffizient: Bezahlen Sie nur, was Sie nutzen, mit transparenten Preisen.
Enterprise-Support: Dedizierter Support für Anwendungen mit hohem Volumen.

Ideale Anwendungsfälle

Mathematische KI-Anwendungen: Erstellen Sie Lernplattformen mit 87,5 % Genauigkeit bei AIME 2025.
Code-Generierungstools: Entwickeln Sie Entwicklungsassistenten mit 73,3 % Erfolgsquote bei LiveCodeBench.
Forschungsplattformen: Stellen Sie Reasoning-Modelle bereit, die mit Branchenführern konkurrieren.
Bildungssoftware: Entwickeln Sie schrittweise Problemlösungsanwendungen.

Erste Schritte auf Novita AI

Registrieren Sie sich in Sekundenschnelle bei Novita AI und sichern Sie sich 10 $ Gratisguthaben
Erkunden Sie DeepSeek-R1-0528 (volle Fähigkeiten) oder DeepSeek-R1-0528-Qwen3-8B (effizient)
Holen Sie sich Ihren API-Schlüssel aus dem Dashboard
Tätigen Sie Ihren ersten API-Aufruf über unsere OpenAI-kompatiblen Endpunkte
Beginnen Sie mit dem Bauen mit branchenführenden Reasoning-Fähigkeiten

Für Python-Benutzer:

from openai import OpenAI

base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"

client = OpenAI(
    base_url=base_url,
    api_key=api_key,
)

stream = True # or False
max_tokens = 1000

response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    extra_body={
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Fazit

Die Modelle der DeepSeek-R1-0528-Serie liefern branchenführende Leistungen zu wettbewerbsfähigen Preisen – mit 91,4 % bei AIME 2024 und 73,3 % bei LiveCodeBench, während sie mit OpenAI-o3 und Gemini-2.5-Pro konkurrieren.

Über die entwicklerfreundliche Plattform von Novita AI erhalten Sie sofortigen Zugriff auf diese hochmodernen Modelle ohne Infrastrukturkomplexität. Mit transparenten Preisen, 10 $ Gratisguthaben und unserer intuitiven API war die Integration weltklassiger Reasoning-Fähigkeiten in Ihre Anwendungen noch nie einfacher.

Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen, und gleichzeitig eine erschwingliche und zuverlässige GPU-Cloud zum Aufbau und zur Skalierung bereitstellt.

DeepSeek-R1-0528 und DeepSeek-R1-0528-Qwen3-8B jetzt auf Novita AI verfügbar

Was ist DeepSeek-R1-0528?