Novita AI erweitert globale GPU-Infrastruktur auf alle wichtigen Kontinente

Novita AI erweitert globale GPU-Infrastruktur auf alle wichtigen Kontinente

Entwickler und Unternehmen, die KI-Anwendungen global einsetzen, benötigen zugängliche, leistungsstarke GPU-Infrastruktur, um Latenzen zu minimieren und Kosten zu senken.

Novita AI bietet jetzt GPU-Dienste auf Unternehmensniveau auf allen wichtigen Kontinenten mit vier neuen Regionen in den Vereinigten Arabischen Emiraten, Großbritannien, Indien und Brasilien.

Dieser Artikel behandelt die Vorteile regionaler GPU-Infrastruktur und globale Bereitstellungsstrategien.

Überblick über die globale GPU-Infrastruktur

Die GPU-Ressourcen von Novita AI werden an mehreren Standorten weltweit gehostet. Diese Standorte bestehen aus Regionen und Zonen, die logische Abstraktionen der zugrunde liegenden physischen Infrastruktur darstellen.

Regionen sind unabhängige geografische Gebiete, die aus Zonen bestehen. Zonen innerhalb einer Region verfügen über Hochgeschwindigkeits-Netzwerkverbindungen mit niedriger Latenz, um effiziente KI-Workloads und Datenübertragungen zu unterstützen.

Wir freuen uns, vier neue Regionen anzukündigen, die jetzt live sind:

  • Naher Osten: Vereinigte Arabische Emirate (AS-AE-01)
  • Europa: Großbritannien (EU-GB-01)
  • Asien: Indien (AS-IN-01)
  • Südamerika: Brasilien (SA-BR-01)

Diese strategischen Ergänzungen gewährleisten eine umfassende globale Abdeckung, bringen leistungsstarke GPU-Rechenleistung näher an Entwickler und Unternehmen auf allen wichtigen Kontinenten und reduzieren die Latenz für KI-Workloads weltweit erheblich.

Bereit, Ihre KI-Workloads global bereitzustellen? Starten Sie jetzt Ihre GPU-Instanzen und erleben Sie die Leistungsfähigkeit unserer weltweiten Infrastruktur.

GPU-Zonen nach Kontinent bei Novita AI

Asien

Region Land/Ort Zonen-Code Status
Indien Indien AS-IN-01 Neu
Japan Tokio JP-TYO-01 Aktiv
Japan Tokio JP-TYO-02 Aktiv
Singapur Singapur AS-SGP-01 Aktiv
Singapur Singapur AS-SGP-02 Aktiv
Hongkong Hongkong CN-HK-01 Aktiv

Nordamerika

Region Land/Ort Zonen-Code Status
Vereinigte Staaten Allgemein US-01 Aktiv
Vereinigte Staaten Allgemein US-02 Aktiv
Vereinigte Staaten Kalifornien US-CA-02 Aktiv
Vereinigte Staaten Kalifornien US-CA-03 Aktiv
Vereinigte Staaten Kalifornien US-CA-06 Aktiv

Europa

Region Land/Ort Zonen-Code Status
Großbritannien Großbritannien EU-GB-01 Neu
Deutschland Deutschland EU-GER-01 Aktiv
Deutschland Deutschland EU-GER-02 Aktiv

Naher Osten

Region Land/Ort Zonen-Code Status
Vereinigte Arabische Emirate Vereinigte Arabische Emirate AS-AE-01 Neu

Südamerika

Region Land/Ort Zonen-Code Status
Brasilien Brasilien SA-BR-01 Neu

Ozeanien

Region Land/Ort Zonen-Code Status
Australien Australien OC-AU-01 Aktiv

Afrika

Region Land/Ort Zonen-Code Status
Südafrika Südafrika AF-ZA-01 Aktiv

Wichtige GPU-Instanztypen und Preise

GPU-Modell VRAM vCPU RAM Preis/Stunde
H100 SXM 80GB 80 GB 22 150 GB $2,56
A100 SXM 80GB 80 GB 14 240 GB $1,60
L40S 48GB 48 GB 28 125 GB $0,55
RTX 5090 32GB 32 GB 16 120 GB $0,50
RTX 4090 24GB (High Frequency) 24 GB 24 58 GB $0,69
RTX 4090 24GB 24 GB 16 62 GB $0,35
RTX 3090 24GB 24 GB 16 58 GB $0,21

Starten Sie mit der perfekten GPU für Ihr Projekt. Durchsuchen Sie alle verfügbaren GPU-Instanzen und wählen Sie Ihre optimale Konfiguration.

Novita AI bietet sowohl On-Demand- als auch Abonnement-GPU-Preismodelle an, um unterschiedlichen Geschäftsanforderungen und Nutzungsmustern gerecht zu werden. Während On-Demand maximale Flexibilität mit stündlicher Abrechnung nach Verbrauch bietet, liefern Abonnementpläne erhebliche Kosteneinsparungen von bis zu 28 % mit garantierter Ressourcenverfügbarkeit für konsistente Workloads.

Regionen und Zonen verstehen

Organisation von Regionen und Zonen: Regionen sind unabhängige geografische Gebiete, die mehrere Zonen für Redundanz und Lastverteilung enthalten. Zonen innerhalb einer Region verfügen über Hochgeschwindigkeits-Netzwerkverbindungen mit geringer Latenz, um effiziente verteilte KI-Workloads zu unterstützen. Zonennamen folgen dem Format <Region>-<Identifikator> – zum Beispiel sind US-CA-02, US-CA-03 und US-CA-06 alle in der Region US-Kalifornien, aber in verschiedenen Verfügbarkeitszonen.

Ressourcentypen: Ressourcen fallen in zwei Kategorien – zonale Ressourcen wie GPU-Instanzen und zugehöriger Speicher, die in bestimmten Zonen existieren, und regionale Ressourcen wie Load Balancer und Netzwerkkonfigurationen, die in einer gesamten Region genutzt werden können. Für optimale Leistung müssen zusammengehörige Ressourcen wie GPU-Instanzen und Hochleistungsspeicher in derselben Zone bereitgestellt werden.

Ausfallsicherheit: Die Verteilung von Ressourcen auf verschiedene Zonen innerhalb einer Region verringert das Risiko, dass Infrastrukturausfälle alle Ressourcen gleichzeitig betreffen. Die Bereitstellung über verschiedene Regionen hinweg bietet eine noch höhere Ausfallsicherheit und ermöglicht robuste KI-Systeme mit Ressourcen, die über verschiedene Ausfallbereiche verteilt sind.

Bereitstellungsstrategie und bewährte Methoden

Faktoren für die Regionsauswahl: Wählen Sie Regionen basierend auf der Nähe zu Benutzern oder Datenquellen, um die Netzwerklatenz zu minimieren – dies ist besonders kritisch für Echtzeit-KI-Inferenzanwendungen. Berücksichtigen Sie regionale Compliance-Anforderungen, da einige Rechtsordnungen spezifische Standortvorgaben für die Datenverarbeitung haben. Bewerten Sie die GPU-Verfgbarkeit, da verschiedene Zonen unterschiedliche Kapazitäten für stark nachgefragte GPU-Typen aufweisen können.

Optimierung von Kosten und Leistung: Die Kommunikation innerhalb einer Region ist in der Regel kosteneffizienter als regionsübergreifende Übertragungen. Gestalten Sie verteilte Trainings- und Inferenzsysteme daher so, dass teure Inter-Region-Bandbreite minimiert wird. Berücksichtigen Sie das Preis-Leistungs-Verhältnis von GPUs – RTX 3090 für 0,21 $/h für Entwicklung und Tests, bis hin zur H100 für 2,56 $/h für Produktions-Workloads, die maximale Leistung erfordern.

Design für hohe Verfügbarkeit: Stellen Sie kritische KI-Systeme über mehrere Zonen oder Regionen hinweg bereit, um Redundanz zu gewährleisten. Hosten Sie zum Beispiel Inferenz-Endpunkte sowohl in AS-SGP-01 als auch in AS-SGP-02, um die Verfügbarkeit sicherzustellen, falls eine Zone Probleme hat. Erwägen Sie für globale Anwendungen die Bereitstellung über Kontinente hinweg, wie US-CA-03, EU-GER-01 und AS-SGP-01. Platzieren Sie zusammengehörige KI-Workloads nach Möglichkeit in derselben Zone – Trainingscluster, Modellspeicher und Vorverarbeitungspipelines arbeiten optimal, wenn sie zusammen bereitgestellt werden.

Fazit

Die Expansion von Novita AI auf alle wichtigen Kontinente mit neuen Regionen in den VAE, Großbritannien, Indien und Brasilien beseitigt geografische Barrieren für Entwickler und Unternehmen, die KI-Lösungen entwickeln.

Diese verteilte Infrastruktur reduziert Latenzen, erhöht die Zuverlässigkeit und ermöglicht die Einhaltung regionaler Vorschriften, während sie flexible GPU-Optionen bietet – von der RTX 3090 für 0,21 $/h für die Entwicklung bis zur H100 für 2,56 $/h für Unternehmensproduktions-Workloads.

Verwandeln Sie Ihre KI-Projekte mit globaler GPU-Infrastruktur. Starten Sie noch heute mit Novita AI und stellen Sie Ihre Workloads in unserem weltweiten Netzwerk bereit.