Novita AI 擴展全球 GPU 基礎設施,遍及所有主要大陸

Novita AI 擴展全球 GPU 基礎設施,遍及所有主要大陸

在全球部署 AI 應用的開發者與企業,需要可存取、高效能的 GPU 基礎設施,以降低延遲並減少成本。

Novita AI 現已在所有主要大陸提供企業級 GPU 服務,並在阿拉伯聯合大公國、英國、印度和巴西新增四個區域。

本文將介紹區域 GPU 基礎設施的優勢及全球部署策略。

全球 GPU 基礎設施概覽

Novita AI 的 GPU 資源託管於全球多個地點。這些地點由區域(Region)和可用區(Zone)組成,提供底層實體基礎設施的邏輯抽象。

區域是獨立的 geographic 區域,包含多個可用區;同一區域內的可用區之間具備高頻寬、低延遲的網路連線,可支援高效的 AI 工作負載與資料傳輸。

我們很高興宣布四個新區域現已上線:

  • 中東:阿拉伯聯合大公國(AS-AE-01)
  • 歐洲:英國(EU-GB-01)
  • 亞洲:印度(AS-IN-01)
  • 南美洲:巴西(SA-BR-01)

這些策略性新增據點確保了全面的全球覆蓋,將高效能 GPU 運算帶到更接近所有主要大陸的開發者與企業,顯著降低全球 AI 工作負載的延遲。

準備好將 AI 工作負載部署到全球了嗎?立即啟動您的 GPU 執行個體,體驗我們全球基礎設施的強大效能。

Novita AI 各洲 GPU 可用區

亞洲

區域 國家/地點 可用區代碼 狀態
印度 印度 AS-IN-01
日本 東京 JP-TYO-01 活躍
日本 東京 JP-TYO-02 活躍
新加坡 新加坡 AS-SGP-01 活躍
新加坡 新加坡 AS-SGP-02 活躍
香港 香港 CN-HK-01 活躍

北美洲

區域 國家/地點 可用區代碼 狀態
美國 通用 US-01 活躍
美國 通用 US-02 活躍
美國 加州 US-CA-02 活躍
美國 加州 US-CA-03 活躍
美國 加州 US-CA-06 活躍

歐洲

區域 國家/地點 可用區代碼 狀態
英國 英國 EU-GB-01
德國 德國 EU-GER-01 活躍
德國 德國 EU-GER-02 活躍

中東

區域 國家/地點 可用區代碼 狀態
阿拉伯聯合大公國 阿聯酋 AS-AE-01

南美洲

區域 國家/地點 可用區代碼 狀態
巴西 巴西 SA-BR-01

大洋洲

區域 國家/地點 可用區代碼 狀態
澳洲 澳洲 OC-AU-01 活躍

非洲

區域 國家/地點 可用區代碼 狀態
南非 南非 AF-ZA-01 活躍

主要 GPU 執行個體類型與定價

GPU 型號 VRAM vCPU RAM 每小時價格
H100 SXM 80GB 80 GB 22 150 GB $2.56
A100 SXM 80GB 80 GB 14 240 GB $1.60
L40S 48GB 48 GB 28 125 GB $0.55
RTX 5090 32GB 32 GB 16 120 GB $0.50
RTX 4090 24GB (高頻) 24 GB 24 58 GB $0.69
RTX 4090 24GB 24 GB 16 62 GB $0.35
RTX 3090 24GB 24 GB 16 58 GB $0.21

從最適合您專案的 GPU 開始。瀏覽所有可用的 GPU 執行個體,選擇最佳配置。

Novita AI 同時提供隨需應變與 訂閱制 GPU 定價模式,以滿足不同的業務需求與使用模式。隨需應變提供按小時計費的最大靈活性,而訂閱方案則可為持續性工作負載節省高達 28% 的成本,並保證資源可用性。

了解區域與可用區

區域與可用區組織:區域是獨立的 geographic 區域,包含多個可用區以提供備援與負載分佈。同一區域內的可用區之間具備高頻寬、低延遲的網路連線,可支援高效的分佈式 AI 工作負載。可用區名稱遵循 <區域>-<識別碼> 格式——例如,US-CA-02、US-CA-03 和 US-CA-06 都屬於美國加州區域,但位於不同的可用區。

資源類型:資源分為兩類——可用區資源(如 GPU 執行個體與附加儲存)位於特定可用區內;以及區域資源(如負載平衡器與網路配置),可在整個區域中使用。為達到最佳效能,相關資源(例如 GPU 執行個體與高效能儲存)必須部署在同一個可用區中。

故障隔離:將資源分散到區域內不同的可用區,可降低基礎設施故障同時影響所有資源的風險。跨不同區域部署則可提供更高的故障隔離性,使 AI 系統能夠透過分散在不同故障域的資源而更穩健。

部署策略與最佳實踐

區域選擇因素:根據與使用者或資料來源的距離選擇區域,以最小化網路延遲,這對於即時 AI 推理應用尤其重要。考量區域合規要求,因為某些司法管轄區對資料處理所在地有特定規定。評估 GPU 可用性,因為不同可用區對高需求 GPU 類型的容量可能不同。

成本與效能最佳化:區域內的通訊通常比跨區域傳輸更具成本效益,因此應設計分散式訓練與推理系統,以最小化昂貴的跨區域頻寬使用。考量 GPU 的每美元效能——RTX 3090 每小時 $0.21 適用於開發與測試,擴展到 H100 每小時 $2.56 適合需要最高效能的生產工作負載。

高可用性設計:將關鍵 AI 系統部署於多個可用區或區域以實現備援。例如,在 AS-SGP-01 和 AS-SGP-02 同時託管推理端點,以確保即使其中一個可用區發生問題仍能持續提供服務。對於全球應用,可考慮跨洲部署,例如 US-CA-03、EU-GER-01 和 AS-SGP-01。在可能的情況下,將相關的 AI 工作負載(如訓練叢集、模型儲存與前處理管線)集中部署於同一可用區,以獲得最佳效能。

結論

Novita AI 擴展至所有主要大陸,並在阿聯酋、英國、印度和巴西新增區域,消除了開發者與企業構建 AI 解決方案的地理障礙。

此分佈式基礎設施降低了延遲、增強了可靠性,並能符合各地法規要求,同時提供靈活的 GPU 選擇——從每小時 $0.21 的 RTX 3090 用於開發,到每小時 $2.56 的 H100 用於企業級生產工作負載。

立即利用全球 GPU 基礎設施轉型您的 AI 專案。今天開始使用 Novita AI,將您的工作負載部署至我們的全球網路。