DeepSeek hat zwei bahnbrechende Modelle veröffentlicht – DeepSeek-R1-0528 und DeepSeek-R1-0528-Qwen3-8B – beide jetzt verfügbar auf Novita AI, einer KI-Cloud-Plattform, die Entwicklern eine einfache Bereitstellung von KI-Modellen über unsere unkomplizierte API bietet. Diese Modelle liefern außergewöhnliche Reasoning-Fähigkeiten zu wettbewerbsfähigen Preisen und übertreffen ihre Vorgänger deutlich.
Novita AI bietet beide DeepSeek-R1-0528-Modelle zu wettbewerbsfähigen Tarifen mit transparentem Pay-per-Use-Preismodell an:
DeepSeek-R1-0528 (Vollmodell):
- Eingabe-Token: 0,70 $ pro Million Token
- Ausgabe-Token: 2,50 $ pro Million Token
DeepSeek-R1-0528-Qwen3-8B (Effizientes 8B-Modell):
- Eingabe-Token: 0,06 $ pro Million Token
- Ausgabe-Token: 0,09 $ pro Million Token
Was ist DeepSeek-R1-0528?
Das DeepSeek R1 Modell hat ein Minor-Update erfahren, die aktuelle Version ist DeepSeek-R1-0528. In diesem neuesten Update hat DeepSeek R1 seine Reasoning-Tiefe und Inferenzfähigkeiten durch den Einsatz erhöhter Rechenressourcen und die Einführung algorithmischer Optimierungsmechanismen während des Post-Trainings deutlich verbessert.
Das Modell zeigt herausragende Leistungen in verschiedenen Benchmark-Auswertungen, darunter Mathematik, Programmierung und allgemeine Logik. Die Gesamtleistung nähert sich nun der führender Modelle wie O3 und Gemini 2.5 Pro an.
Wichtige Verbesserungen von DeepSeek-R1-0528
🔹 Verbesserte Benchmark-Ergebnisse bei Mathematik, Programmierung und Reasoning-Aufgaben
🔹 Verbesserte Frontend-Funktionen für ein besseres Benutzererlebnis
🔹 Reduzierte Halluzinationen für zuverlässigere Ausgaben
🔹 Unterstützt JSON-Ausgabe & Funktionsaufrufe für nahtlose Integration
Erhöhte Reasoning-Tiefe
Im Vergleich zur Vorgängerversion zeigt das aktualisierte Modell deutliche Verbesserungen bei der Verarbeitung komplexer Reasoning-Aufgaben. So stieg die Genauigkeit des Modells im AIME-2025-Test von 70 % in der vorherigen Version auf 87,5 % in der aktuellen Version.
Dieser Fortschritt resultiert aus einer erhöhten Denktiefe während des Reasoning-Prozesses: Im AIME-Testsatz verwendete das vorherige Modell durchschnittlich 12.000 Token pro Frage, während die neue Version durchschnittlich 23.000 Token pro Frage benötigt.
Wettbewerbsfähige Leistung im Vergleich zu Branchenführern
DeepSeek-R1-0528 zeigt bemerkenswerte Leistungen im Vergleich zu branchenführenden Modellen in verschiedenen anspruchsvollen Benchmarks:

DeepSeek-R1 vs. DeepSeek-R1-0528
Mathematische Reasoning-Leistung
| Benchmark | DeepSeek R1 | DeepSeek R1-0528 | Verbesserung |
|---|---|---|---|
| AIME 2024 (Pass@1) | 79,8 | 91,4 | +11,6 |
| AIME 2025 (Pass@1) | 70,0 | 87,5 | +17,5 |
| HMMT 2025 (Pass@1) | 41,7 | 79,4 | +37,7 |
| CNMO 2024 (Pass@1) | 78,8 | 86,9 | +8,1 |
Verbesserung der Programmierleistung
| Benchmark | DeepSeek R1 | DeepSeek R1-0528 | Verbesserung |
|---|---|---|---|
| LiveCodeBench (Pass@1) | 63,5 | 73,3 | +9,8 |
| Codeforces-Div1 (Rating) | 1530 | 1930 | +400 |
| SWE Verified (Gelöst) | 49,2 | 57,6 | +8,4 |
| Aider-Polyglot (Genauigkeit) | 53,3 | 71,6 | +18,3 |
Allgemeine Reasoning-Aufgaben
| Benchmark | DeepSeek R1 | DeepSeek R1-0528 | Verbesserung |
|---|---|---|---|
| MMLU-Redux (EM) | 92,9 | 93,4 | +0,5 |
| MMLU-Pro (EM) | 84,0 | 85,0 | +1,0 |
| GPQA-Diamond (Pass@1) | 71,5 | 81,0 | +9,5 |
| SimpleQA (Richtig) | 30,1 | 27,8 | -2,3 |
| FRAMES (Genauigkeit) | 82,5 | 83,0 | +0,5 |
| Humanity’s Last Exam (Pass@1) | 8,5 | 17,7 | +9,2 |
Neue Fähigkeiten zur Tool-Integration
DeepSeek-R1-0528 führt erweiterte Fähigkeiten für Funktionsaufrufe und Tool-Integration ein:
- BFCL_v3_MultiTurn (Genauigkeit): 37,0 %
- Tau-Bench (Pass@1): 53,5 % (Airline) / 63,9 % (Retail)
DeepSeek-R1-0528-Qwen3-8B: Kompakte Exzellenz
DeepSeek destillierte das Chain-of-Thought-Reasoning von DeepSeek-R1-0528, um DeepSeek-R1-0528-Qwen3-8B aus Qwen3 8B Base zu erstellen. Dieses Modell erzielt bei AIME 2024 eine State-of-the-Art (SOTA)-Leistung unter den Open-Source-Modellen und übertrifft Qwen3-8B um +10,0 %, während es die Leistung von Qwen3-235B-thinking erreicht.
Dies zeigt, dass das Chain-of-Thought-Reasoning von DeepSeek-R1-0528 sowohl für die akademische Forschung an Reasoning-Modellen als auch für die industrielle Entwicklung kleiner Modelle von großer Bedeutung ist.
Wettbewerbsanalyse mit führenden Modellen
| Modell | AIME 24 | AIME 25 | HMMT Feb 25 | GPQA Diamond | LiveCodeBench |
|---|---|---|---|---|---|
| Qwen3-235B-A22B | 85,7 | 81,5 | 62,5 | 71,1 | 66,5 |
| Qwen3-32B | 81,4 | 72,9 | - | 68,4 | - |
| Qwen3-8B | 76,0 | 67,3 | - | 62,0 | - |
| Phi-4-Reasoning-Plus-14B | 81,3 | 78,0 | 53,6 | 69,3 | - |
| Gemini-2.5-Flash-Thinking-0520 | 82,3 | 72,0 | 64,2 | 82,8 | 62,3 |
| o3-mini (medium) | 79,6 | 76,7 | 53,3 | 76,8 | 65,9 |
| DeepSeek-R1-0528-Qwen3-8B | 86,0 | 76,3 | 61,5 | 61,1 | 60,5 |
Nutzungsverbesserungen und technische Details
Verbesserte Benutzerfreundlichkeit
Im Vergleich zu früheren Versionen von DeepSeek-R1 umfassen die Nutzungsempfehlungen für DeepSeek-R1-0528 die folgenden Verbesserungen:
- System-Prompt-Unterstützung: Im Gegensatz zu früheren Versionen können Sie jetzt System-Prompts verwenden, um einen konsistenten Kontext und Anweisungen bereitzustellen.
- Automatisches Denkmuster: Keine manuelle Aktivierung erforderlich – das Modell aktiviert automatisch seine Reasoning-Fähigkeiten, ohne dass am Anfang der Ausgaben " thinking\ " stehen muss.
DeepSeek-R1-0528-Qwen3-8B-Architektur
Die Modellarchitektur von DeepSeek-R1-0528-Qwen3-8B ist identisch mit der von Qwen3-8B, verwendet jedoch die gleiche Tokenizer-Konfiguration wie DeepSeek-R1-0528. Dieses Modell kann auf die gleiche Weise wie Qwen3-8B ausgeführt werden, aber stellen Sie sicher, dass alle Konfigurationsdateien aus dem DeepSeek-Repository stammen, nicht aus dem ursprünglichen Qwen3-Projekt.
Warum Entwickler Novita AI wählen
Vereinfachte Bereitstellung von KI-Modellen
- Keine Infrastruktur-Probleme: Konzentrieren Sie sich auf die Entwicklung von Anwendungen, nicht auf die Verwaltung von Servern.
- Sofortiger Modellzugriff: Stellen Sie hochmoderne Modelle mit einem einzigen API-Aufruf bereit.
- Zuverlässige Leistung: Unternehmensinfrastruktur mit 99,9 % Verfügbarkeit.
- Globale Verfügbarkeit: Geringe Latenz von überall auf der Welt.
Perfekt für jede Größenordnung
- Schnelles Prototyping: Testen Sie Ideen schnell mit sofortigem Modellzugriff.
- Produktionsreif: Skalieren Sie nahtlos vom Prototyp zur Produktion.
- Kosteneffizient: Bezahlen Sie nur, was Sie nutzen, mit transparenten Preisen.
- Enterprise-Support: Dedizierter Support für Anwendungen mit hohem Volumen.
Ideale Anwendungsfälle
- Mathematische KI-Anwendungen: Erstellen Sie Lernplattformen mit 87,5 % Genauigkeit bei AIME 2025.
- Code-Generierungstools: Entwickeln Sie Entwicklungsassistenten mit 73,3 % Erfolgsquote bei LiveCodeBench.
- Forschungsplattformen: Stellen Sie Reasoning-Modelle bereit, die mit Branchenführern konkurrieren.
- Bildungssoftware: Entwickeln Sie schrittweise Problemlösungsanwendungen.
Erste Schritte auf Novita AI
- Registrieren Sie sich in Sekundenschnelle bei Novita AI und sichern Sie sich 10 $ Gratisguthaben
- Erkunden Sie DeepSeek-R1-0528 (volle Fähigkeiten) oder DeepSeek-R1-0528-Qwen3-8B (effizient)
- Holen Sie sich Ihren API-Schlüssel aus dem Dashboard
- Tätigen Sie Ihren ersten API-Aufruf über unsere OpenAI-kompatiblen Endpunkte
- Beginnen Sie mit dem Bauen mit branchenführenden Reasoning-Fähigkeiten
Für Python-Benutzer:
from openai import OpenAI
base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"
client = OpenAI(
base_url=base_url,
api_key=api_key,
)
stream = True # or False
max_tokens = 1000
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
extra_body={
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Fazit
Die Modelle der DeepSeek-R1-0528-Serie liefern branchenführende Leistungen zu wettbewerbsfähigen Preisen – mit 91,4 % bei AIME 2024 und 73,3 % bei LiveCodeBench, während sie mit OpenAI-o3 und Gemini-2.5-Pro konkurrieren.
Über die entwicklerfreundliche Plattform von Novita AI erhalten Sie sofortigen Zugriff auf diese hochmodernen Modelle ohne Infrastrukturkomplexität. Mit transparenten Preisen, 10 $ Gratisguthaben und unserer intuitiven API war die Integration weltklassiger Reasoning-Fähigkeiten in Ihre Anwendungen noch nie einfacher.
Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen, und gleichzeitig eine erschwingliche und zuverlässige GPU-Cloud zum Aufbau und zur Skalierung bereitstellt.
