Wichtige Highlights
Novita AI hat DeepSeek R1 Turbo eingeführt, das 3-fachen Durchsatz und einen befristeten Rabatt von 60 % bietet. Darüber hinaus unterstützt diese Version vollständig Funktionsaufrufe.
Sie können eine kostenlose Testversion auf Novita AI starten!

Noch spannender: Novita AI belegt Platz 1 für DeepSeek R1 API auf OpenRouter

Jetzt DeepSeek R1 Demo testen!
Was ist DeepSeek R1?
- Veröffentlichungsdatum: 21. Januar 2025
- Modellgrößen:
- Hauptmerkmale:
- Modellgröße: 671B Parameter (37B aktiv/Token)
- Tokenizer: Verbesserter Tokenizer mit Selbstreflexions-Tags
- Unterstützte Sprachen: Mehrsprachig mit kultureller Anpassung
- Multimodal: Nur Text
- Kontextfenster: 128K Token
- Speicherformate: Q8/Q5-Quantisierungsunterstützung
- Architektur: Mixture of Experts (MoE) + RL-gestützte Trainingspipeline
- Trainingsmethode: Auf V3-Basis mit RL-Pipeline (SFT → RL → SFT → RL)
- Trainingsdaten: V3-Basis + RL-Optimierungsdaten

Benchmark

DeepSeek-R1 zeigt bei den meisten Aufgaben deutliche Leistungssteigerungen, insbesondere eine Verbesserung von 9,0 % und 5,7 % bei den Aufgaben Codeforces bzw. GPQA Diamond, was seine starken Fähigkeiten bei der Bewältigung komplexer Aufgaben unterstreicht.
Hardware-Anforderungen für DeepSeek R1
| Modell | Präzision | GPU | Menge |
|---|---|---|---|
| DeepSeek-R1-Distill-Qwen-1.5B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-7B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Llama-8B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-14B | BF16 | RTX 4090 | 2 |
| DeepSeek-R1-Distill-Qwen-32B | BF16 | RTX 4090 | 4 |
| DeepSeek-R1-Distill-Llama-70B | BF16 | RTX 4090 | 8 |
| DeepSeek-R1 (671B) | BF16 | H100 | 8 |
Die Hardware-Anforderungen von DeepSeek-R1 sind klar abgestuft:
- Destillierte Modelle haben relativ geringe Hardware-Anforderungen, insbesondere bei kleinen und mittleren Größen, und eignen sich für hochwertige Consumer-Hardware (z. B. RTX 4090).
- Vollständige Modelle haben extrem hohe Hardware-Anforderungen, insbesondere sehr große Modelle, die auf professionelle Hardware (z. B. H100 GPUs) angewiesen sind.
- Insgesamt reduziert die Destillationstechnologie die Hardware-Anforderungen erheblich und erhöht die Flexibilität der Modellbereitstellung, aber vollständige Modelle benötigen dennoch sehr leistungsstarke Hardware, um Spitzenleistungen zu erzielen.
Wenn Sie den Kauf von GPUs oder die eigene Bereitstellung als zu kompliziert empfinden, können Sie die GPU- und API-Dienste von Novita AI nutzen, die eine vollständig optimierte Version von DeepSeek-R1 bieten. Dies ist äußerst bequem und wird auf Basis der Token-Anzahl abgerechnet.
Novita AI für Cloud-GPU-Dienste wählen
Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen, und gleichzeitig eine erschwingliche und zuverlässige GPU-Cloud zum Aufbau und zur Skalierung bereitstellt.
Schritt 1: Registrieren Sie ein Konto
Wenn Sie neu bei Novita AI sind, erstellen Sie zunächst ein Konto auf unserer Website. Nach der Registrierung gehen Sie zum Tab „GPUs", um verfügbare Ressourcen zu erkunden und Ihre Reise zu beginnen.

Schritt 2: Vorlagen und GPU-Server erkunden
Wählen Sie zunächst eine Vorlage, die Ihren Projektanforderungen entspricht, z. B. PyTorch, TensorFlow oder CUDA. Wählen Sie die Version, die Ihren Anforderungen entspricht, z. B. PyTorch 2.2.1 oder CUDA 11.8.0. Wählen Sie dann die GPU-Serverkonfiguration A100, die eine hohe Leistung bietet, um anspruchsvolle Arbeitslasten mit ausreichend VRAM, RAM und Speicherkapazität zu bewältigen.

Testen Sie die Hochleistungs-GPUs von Novita AI
Schritt 3: Passen Sie Ihre Bereitstellung an
Passen Sie nach der Auswahl einer Vorlage und GPU Ihre Bereitstellungseinstellungen an, indem Sie Parameter wie die Betriebssystemversion (z. B. CUDA 11.8) anpassen. Sie können auch andere Konfigurationen optimieren, um die Umgebung an die spezifischen Anforderungen Ihres Projekts anzupassen.

Schritt 4: Starten Sie eine Instanz
Nachdem Sie die Vorlage und die Bereitstellungseinstellungen festgelegt haben, klicken Sie auf „Instanz starten", um Ihre GPU-Instanz einzurichten. Dadurch wird die Umgebungseinrichtung gestartet, sodass Sie die GPU-Ressourcen für Ihre KI-Aufgaben nutzen können.

Novita AI für API-Dienste wählen
Novita AI ist eine KI-Cloud-Plattform, die Entwicklern eine einfache Möglichkeit bietet, KI-Modelle über unsere einfache API bereitzustellen, und gleichzeitig eine erschwingliche und zuverlässige GPU-Cloud zum Aufbau und zur Skalierung bereitstellt.
Schritt 1: Anmelden und auf die Modellbibliothek zugreifen
Melden Sie sich bei Ihrem Konto an und klicken Sie auf die Schaltfläche Modellbibliothek.

Jetzt DeepSeek R1 Demo testen!
Schritt 2: Wählen Sie Ihr Modell
Durchsuchen Sie die verfügbaren Optionen und wählen Sie das Modell aus, das Ihren Anforderungen entspricht.

Schritt 3: Starten Sie Ihre kostenlose Testversion
Beginnen Sie Ihre kostenlose Testversion, um die Fähigkeiten des ausgewählten Modells zu erkunden.

Schritt 4: Holen Sie sich Ihren API-Schlüssel
Zur Authentifizierung mit der API stellen wir Ihnen einen neuen API-Schlüssel zur Verfügung. Rufen Sie die Seite „Einstellungen“ auf und kopieren Sie den API-Schlüssel wie im Bild gezeigt.

Schritt 5: Installieren Sie die API
Installieren Sie die API mit dem für Ihre Programmiersprache spezifischen Paketmanager.

Importieren Sie nach der Installation die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit Novita AI LLM zu interagieren. Dies ist ein Beispiel für die Verwendung der Chat-Completions-API für Python-Benutzer.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<IHR Novita AI API-Schlüssel>",
)
model = "deepseek/deepseek_r1"
stream = True # oder False
max_tokens = 2048
system_content = """Seien Sie ein hilfreicher Assistent"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hallo!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Novita AI revolutioniert die KI-Bereitstellung mit DeepSeek R1 Turbo und bietet 3-fachen Durchsatz und Unterstützung für erweiterte Funktionen wie Funktionsaufrufe, jetzt mit einem befristeten Rabatt von 20 %. Egal, ob Sie destillierte Modelle auf Consumer-GPUs wie RTX 4090 ausführen oder vollständige Modelle mit Enterprise-Grade H100 GPUs bereitstellen, Novita AI bietet unübertroffene Flexibilität. Für diejenigen, die eine problemlose Lösung suchen, bieten die GPU- und API-Dienste von Novita AI eine vollständig optimierte Version von DeepSeek R1 Turbo, gepaart mit tokenbasierter Preisgestaltung und einer kostenlosen Testversion. Erleben Sie KI-Leistung der nächsten Stufe mit DeepSeek R1 Turbo – starten Sie noch heute mit Novita AI!
Häufig gestellte Fragen
Was ist DeepSeek R1 Turbo?
DeepSeek R1 Turbo ist eine optimierte Version von DeepSeek R1, die 3-fachen Durchsatz, vollständige Unterstützung für Funktionsaufrufe und einen befristeten Rabatt von 20 % auf Novita AI bietet!
Welche Hardware wird zum Ausführen von DeepSeek R1 benötigt?
Vollständige Modelle: Erfordern Enterprise-Grade GPUs wie H100 für optimale Leistung.
Kann ich DeepSeek R1 kostenlos testen?
Ja, Novita AI bietet eine kostenlose Testversion für DeepSeek R1 über seine API-Plattform an.
Novita AI ist die All-in-One-Cloud-Plattform, die Ihre KI-Ambitionen beflügelt. Integrierte APIs, serverlos, GPU-Instanz – die kosteneffizienten Tools, die Sie benötigen. Infrastruktur eliminieren, kostenlos starten und Ihre KI-Vision verwirklichen.
