- Unterschied zwischen Spot- und On-Demand-Instanzen
- Leistungsbenchmarks: Spot vs. On-Demand-Instanzen
- On-Demand vs. Spot-Instanzen für maschinelles Lernen oder Tests
- Kostenvergleich: Spot-Instanzen vs. On-Demand-Instanzen
- Sind Spot-Instanzen für meine Datenbank-Workload geeignet?
- Best Practices für Spot-Instanzen
Beim Starten von Cloud-Instanzen stehen Entwickler*innen oft vor der Wahl zwischen On-Demand-Instanzen und Spot-Instanzen. On-Demand-Instanzen bieten zuverlässige Rechenkapazität zu einem festen Preis, während Spot-Instanzen die gleiche Hardware mit hohen Rabatten im Austausch für mögliche Unterbrechungen anbieten.
Dieser Leitfaden erläutert die grundlegenden Unterschiede zwischen Spot- und On-Demand-Instanzen, vergleicht die Leistung, diskutiert Anwendungsfälle (wie maschinelles Lernen und Tests), bewertet Kosten anhand von Beispielen und gibt Best Practices für die Nutzung von Spot-Instanzen in realen Szenarien.
Unterschied zwischen Spot- und On-Demand-Instanzen
🟩 Verfügbarkeit und Unterbrechungen
- On-Demand-Instanzen
- Laufen kontinuierlich, bis Sie sie stoppen oder beenden
- Garantierte Verfügbarkeit, außer bei sehr seltenen Kapazitätsfehlern
- Spot-Instanzen
- Werden aus freier Kapazität bezogen und können kurzfristig zurückgefordert werden
- Beispiel: Einige Anbieter (z. B. Novita AI) geben eine 1-stündige Unterbrechungsankündigung und eine 1-stündige Mindestlaufzeitgarantie für Spot-GPU-Instanzen
- Wichtiger Kompromiss: On-Demand gewährleistet kontinuierliche Verfügbarkeit; Spot nicht.
🟩 Preismodell
- On-Demand-Preise
- Fester Tarif (pro Sekunde oder pro Stunde) für einen bestimmten Instanztyp und eine bestimmte Region
- Stabile, vorhersehbare Preise ohne Risiko von ungewollten Abschaltungen
- Spot-Preise
- Dynamisch und stark rabattiert (in der Regel 50 %–90 % günstiger als On-Demand)
- Beispiel: Novita AI Spot-GPU-Instanzen sind ca. 50 % günstiger (z. B. RTX 4090 für ca. 0,18 $/Stunde statt 0,35 $/Stunde bei On-Demand)
- Die Preise können im Laufe der Zeit schwanken; Instanzen können beendet werden, wenn Kapazität benötigt wird
- Wichtiger Kompromiss: On-Demand = stabil und zuverlässig; Spot = günstiger, aber volatil.
🟩 Anwendungsfälle
- On-Demand-Instanzen
- Am besten geeignet für Workloads, die unterbrechungsfreien Service erfordern
- Produktionsanwendungen, Datenbanken, geschäftskritische Systeme
- Kurzfristige Jobs mit unvorhersehbarer Dauer (keine Vorabverpflichtung)
- Spot-Instanzen
- Am besten geeignet für flexible, fehlertolerante Workloads, die Unterbrechungen verkraften können
- Beispiele: Stapelverarbeitung, Datenanalyse, Big-Data-Pipelines, CI/CD-Runner, Rendering, Hintergrundaufgaben
- Häufig Spot-freundliche Workloads: zustandslose Webserver, containerisierte Umgebungen, HPC-Jobs, Test-/Entwicklungsumgebungen
- Wichtiger Kompromiss: On-Demand = garantierte Betriebszeit; Spot = Kosteneinsparungen, wenn Unterbrechungen tolerierbar sind.
Leistungsbenchmarks: Spot vs. On-Demand-Instanzen
Entwickler*innen können bei Spot- und On-Demand-Instanzen des gleichen Instanztyps von identischer Leistung ausgehen. Planen Sie Unterbrechungen ein, aber machen Sie sich keine Sorgen über Unterschiede bei CPU-Geschwindigkeit oder Speicher – Spot ist ein Preismodell, keine Leistungsstufe.

Von 66 Degrees
On-Demand vs. Spot-Instanzen für maschinelles Lernen oder Tests

1. ML-Training / Stapeljobs
Empfohlen: Spot-Instanzen mit Checkpointing
Grund:
- Trainingsjobs sind von Natur aus fehlertolerant (insbesondere bei gespeicherten Checkpoints).
- Spot bietet bis zu 90 % Kosteneinsparungen.
- Perfekte Übereinstimmung für groß angelegtes Modelltraining, Hyperparameter-Tuning oder Datenverarbeitung.
2. ML-Inferenz / Produktionsservices
Empfohlen: On-Demand-Instanzen für die Grundlast + Spot-Instanzen für zusätzliche Kapazität
Grund:
- Echtzeit-Inferenz erfordert hohe Verfügbarkeit.
- On-Demand gewährleistet Stabilität; Spot bietet kosteneffektive Skalierung für nicht geschäftskritische Aufgaben.
- Nutzen Sie Spot nur, wenn der Service Verzögerungen tolerieren kann oder über Failover-Mechanismen verfügt.
3. Tests / Entwicklungsumgebungen
Empfohlen: Spot-Instanzen, aber nur, wenn Sie die Umgebungseinrichtung automatisieren
Grund:
- Dev-/Test-Workloads sind temporär und neu startbar.
- Spot ist äußerst kosteneffektiv für CI/CD-Runner, Staging-Umgebungen oder Sandboxen.
- Für langlebige oder zustandsbehaftete Dev-Services benötigen Sie IaC oder Containerisierung, um sich schnell von Unterbrechungen zu erholen.
Kostenvergleich: Spot-Instanzen vs. On-Demand-Instanzen
| Instanz (GPU) | On-Demand-Preis | Spot-Preis |
|---|---|---|
| RTX 5090 | $0.50 pro Stunde | $0.25 pro Stunde |
| RTX 4090 | $0.35 pro Stunde | $0.18 pro Stunde |
| High frequency RTX 4090 | $0.69 pro Stunde | $0.35 pro Stunde |
| H200 SXM | $3.25 pro Stunde | $1.63 pro Stunde |
| A100 SXM | / | $1.60 pro Stunde |
| B200 | $3.84 pro Stunde | $1.92 pro Stunde |
| H100 SXM | $1.00 pro Stunde | $0.90 pro Stunde |
Starten Sie jetzt Ihre erste Spot-Instanz

Visualisierung des Kostenunterschieds: Wenn Sie einen Bestand von 10 solchen Instanzen einen Monat lang (720 Stunden) ununterbrochen betreiben würden, lägen die On-Demand-Kosten bei: 10 * 0,096 $ * 720 ≈ 691 $. Die Spot-Kosten (zu 0,028 $) für den gleichen Zeitraum lägen bei: 10 * 0,028 $ * 720 ≈ 202 $.

Natürlich sind Kosten nicht alles – eine unterbrochene Instanz kann einen Job verzögern oder zu Ausfallzeiten führen, wenn sie nicht ordnungsgemäß behandelt wird. Für viele Workloads lohnt sich der Kostenkompromiss jedoch allemal. Der Schlüssel liegt darin, Einsparungen zu maximieren und gleichzeitig Risiken zu mindern, was uns zur Frage führt, ob Spot-Instanzen für sensiblere Workloads wie Datenbanken geeignet sind.
Sind Spot-Instanzen für meine Datenbank-Workload geeignet?
Vermeiden Sie die Nutzung von Spot-ähnlichen Instanzen für alle geschäftskritischen, zustandsbehafteten oder Einzelinstanz-Datenbanken.
Nutzen Sie sie nur für ausfallsichere Cluster, Replikate oder nicht geschäftskritische Umgebungen, um Kosten und Zuverlässigkeit in Einklang zu bringen.
Wann sie akzeptabel sein können
Nutzen Sie Spot-ähnliche Rechenkapazität nur, wenn:
- Die Datenbank ist verteilt und repliziert
- Das System ist ausfallsicher gegenüber Knotenverlusten
- Die Workload ist nicht geschäftskritisch oder dient Testzwecken
Beispiele:
- Nutzung von Spot für Lesereplikate, während die primäre Instanz auf stabiler Rechenkapazität läuft
- Verteilte Datenbanken wie CockroachDB oder Cassandra, die Knotenausfälle tolerieren
- Caching-Systeme (z. B. Redis), bei denen Datenverlust nicht kritisch ist
Best Practices zur Risikominimierung
| Strategie | Beschreibung |
|---|---|
| Replikation & automatische Wiederherstellung | Nutzen Sie Multi-Knoten-Cluster, die verlorene Knoten automatisch ersetzen können |
| Häufige Snapshots | Erstellen Sie regelmäßig Backups für eine schnelle Wiederherstellung nach einem Ausfall |
| Isolieren Sie primäre Workloads | Betreiben Sie primäre DB-Knoten auf stabiler Infrastruktur; nutzen Sie Spot nur für sekundäre Rollen |
| Automatisieren Sie den Knotenersatz | Nutzen Sie Orchestrierung (z. B. Kubernetes), um verlorene Datenbankknoten schnell neu zu erstellen |
Best Practices für Spot-Instanzen
Wenn Sie eine Plattform wie Novita AI für GPU-Rechenkapazität nutzen, ist der Wechsel zu Spot oft so einfach wie das Umlegen eines UI-Schalters.
Schritt 1: Zugriff auf Ihre Konsole
Melden Sie sich bei Ihrer Novita AI GPU-Konsole an

Schritt 2: Wechseln Sie zur Spot-Abrechnung
Ändern Sie im rechten Seitenbereich unter Filter die Abrechnungsmethode auf “Spot”, um die rabattierten Preise zu sehen

Schritt 3: Bereitstellen
Wählen Sie Ihre GPU-Konfiguration aus und klicken Sie auf “Bereitstellen”
Das war’s! Ihre Spot-Instanz wird mit den folgenden Eigenschaften gestartet:
- 1-stündige Schutzfrist
- Bis zu 50 % Kosteneinsparungen
- 1-stündige Vorankündigung von Unterbrechungen
Profi-Tipp: Implementieren Sie Checkpointing in Ihrer Anwendung, um mögliche Unterbrechungen reibungslos zu bewältigen…
Für Entwickler*innen und Teams sind Spot-Instanzen ein leistungsstarkes Kosteneinspar-Tool – im Wesentlichen können Sie Cloud-Rechenkapazität für einen Bruchteil des Preises mieten. Der grundlegende Kompromiss ist klar: Sie tauschen die absolute Garantie für Betriebszeit gegen einen viel niedrigeren Preis ein. On-Demand-Instanzen bleiben das Arbeitspferd für geschäftskritische, zustandsbehaftete oder unvorhersehbare Workloads, bei denen Kontinuität oberste Priorität hat. Spot-Instanzen können jedoch einen enormen Wert für Jobs freisetzen, die einen oder zwei Neustarts verkraften können. Wenn Sie die Unterschiede bei Verfügbarkeit und Preis verstehen, sorgfältig auswählen, welche Workloads für Spot geeignet sind, und Best Practices wie Checkpointing und gemischte Instanzbereitstellungen befolgen, können Sie Spot-Instanzen zuversichtlich in Ihre Infrastruktur integrieren.
Häufig gestellte Fragen
Was ist der Hauptunterschied zwischen Spot- und On-Demand-Instanzen?
On-Demand-Instanzen bieten stabile, garantierte Betriebszeit zu einem festen Preis.
Spot-Instanzen sind viel günstiger, können aber jederzeit unterbrochen werden.
Wann sollte ich Spot-Instanzen wählen?
Wählen Sie Spot, wenn Ihre Workload:
fehlertolerant ist
unterbrechbar ist
zeitlich flexibel ist (z. B. Training, Tests, Stapeljobs)
Sind Spot-Instanzen langsamer als On-Demand-Instanzen?
Nein. Spot und On-Demand bieten identische Leistung für den gleichen Instanztyp.
Der Unterschied liegt nur in Preis und Verfügbarkeit, nicht in der Hardware.
Novita AI ist die All-in-One-Cloud-Plattform, die Ihre KI-Ambitionen unterstützt. Integrierte APIs, Serverless, GPU-Instanzen – die kosteneffektiven Tools, die Sie brauchen. Eliminieren Sie Infrastruktur, starten Sie kostenlos und machen Sie Ihre KI-Vision zur Realität.
Empfohlene Lektüre
Trae oder Claude Code: Welches eignet sich besser für die Nutzung mit Kimi K2?
