在全球部署 AI 應用的開發者與企業,需要可存取、高效能的 GPU 基礎設施,以降低延遲並減少成本。
Novita AI 現已在所有主要大陸提供企業級 GPU 服務,並在阿拉伯聯合大公國、英國、印度和巴西新增四個區域。
本文將介紹區域 GPU 基礎設施的優勢及全球部署策略。
全球 GPU 基礎設施概覽
Novita AI 的 GPU 資源託管於全球多個地點。這些地點由區域(Region)和可用區(Zone)組成,提供底層實體基礎設施的邏輯抽象。
區域是獨立的 geographic 區域,包含多個可用區;同一區域內的可用區之間具備高頻寬、低延遲的網路連線,可支援高效的 AI 工作負載與資料傳輸。
我們很高興宣布四個新區域現已上線:
- 中東:阿拉伯聯合大公國(AS-AE-01)
- 歐洲:英國(EU-GB-01)
- 亞洲:印度(AS-IN-01)
- 南美洲:巴西(SA-BR-01)
這些策略性新增據點確保了全面的全球覆蓋,將高效能 GPU 運算帶到更接近所有主要大陸的開發者與企業,顯著降低全球 AI 工作負載的延遲。
準備好將 AI 工作負載部署到全球了嗎?立即啟動您的 GPU 執行個體,體驗我們全球基礎設施的強大效能。
Novita AI 各洲 GPU 可用區
亞洲
| 區域 | 國家/地點 | 可用區代碼 | 狀態 |
|---|---|---|---|
| 印度 | 印度 | AS-IN-01 | 新 |
| 日本 | 東京 | JP-TYO-01 | 活躍 |
| 日本 | 東京 | JP-TYO-02 | 活躍 |
| 新加坡 | 新加坡 | AS-SGP-01 | 活躍 |
| 新加坡 | 新加坡 | AS-SGP-02 | 活躍 |
| 香港 | 香港 | CN-HK-01 | 活躍 |
北美洲
| 區域 | 國家/地點 | 可用區代碼 | 狀態 |
|---|---|---|---|
| 美國 | 通用 | US-01 | 活躍 |
| 美國 | 通用 | US-02 | 活躍 |
| 美國 | 加州 | US-CA-02 | 活躍 |
| 美國 | 加州 | US-CA-03 | 活躍 |
| 美國 | 加州 | US-CA-06 | 活躍 |
歐洲
| 區域 | 國家/地點 | 可用區代碼 | 狀態 |
|---|---|---|---|
| 英國 | 英國 | EU-GB-01 | 新 |
| 德國 | 德國 | EU-GER-01 | 活躍 |
| 德國 | 德國 | EU-GER-02 | 活躍 |
中東
| 區域 | 國家/地點 | 可用區代碼 | 狀態 |
|---|---|---|---|
| 阿拉伯聯合大公國 | 阿聯酋 | AS-AE-01 | 新 |
南美洲
| 區域 | 國家/地點 | 可用區代碼 | 狀態 |
|---|---|---|---|
| 巴西 | 巴西 | SA-BR-01 | 新 |
大洋洲
| 區域 | 國家/地點 | 可用區代碼 | 狀態 |
|---|---|---|---|
| 澳洲 | 澳洲 | OC-AU-01 | 活躍 |
非洲
| 區域 | 國家/地點 | 可用區代碼 | 狀態 |
|---|---|---|---|
| 南非 | 南非 | AF-ZA-01 | 活躍 |
主要 GPU 執行個體類型與定價
| GPU 型號 | VRAM | vCPU | RAM | 每小時價格 |
|---|---|---|---|---|
| H100 SXM 80GB | 80 GB | 22 | 150 GB | $2.56 |
| A100 SXM 80GB | 80 GB | 14 | 240 GB | $1.60 |
| L40S 48GB | 48 GB | 28 | 125 GB | $0.55 |
| RTX 5090 32GB | 32 GB | 16 | 120 GB | $0.50 |
| RTX 4090 24GB (高頻) | 24 GB | 24 | 58 GB | $0.69 |
| RTX 4090 24GB | 24 GB | 16 | 62 GB | $0.35 |
| RTX 3090 24GB | 24 GB | 16 | 58 GB | $0.21 |
從最適合您專案的 GPU 開始。瀏覽所有可用的 GPU 執行個體,選擇最佳配置。
Novita AI 同時提供隨需應變與 訂閱制 GPU 定價模式,以滿足不同的業務需求與使用模式。隨需應變提供按小時計費的最大靈活性,而訂閱方案則可為持續性工作負載節省高達 28% 的成本,並保證資源可用性。
了解區域與可用區
區域與可用區組織:區域是獨立的 geographic 區域,包含多個可用區以提供備援與負載分佈。同一區域內的可用區之間具備高頻寬、低延遲的網路連線,可支援高效的分佈式 AI 工作負載。可用區名稱遵循 <區域>-<識別碼> 格式——例如,US-CA-02、US-CA-03 和 US-CA-06 都屬於美國加州區域,但位於不同的可用區。
資源類型:資源分為兩類——可用區資源(如 GPU 執行個體與附加儲存)位於特定可用區內;以及區域資源(如負載平衡器與網路配置),可在整個區域中使用。為達到最佳效能,相關資源(例如 GPU 執行個體與高效能儲存)必須部署在同一個可用區中。
故障隔離:將資源分散到區域內不同的可用區,可降低基礎設施故障同時影響所有資源的風險。跨不同區域部署則可提供更高的故障隔離性,使 AI 系統能夠透過分散在不同故障域的資源而更穩健。
部署策略與最佳實踐
區域選擇因素:根據與使用者或資料來源的距離選擇區域,以最小化網路延遲,這對於即時 AI 推理應用尤其重要。考量區域合規要求,因為某些司法管轄區對資料處理所在地有特定規定。評估 GPU 可用性,因為不同可用區對高需求 GPU 類型的容量可能不同。
成本與效能最佳化:區域內的通訊通常比跨區域傳輸更具成本效益,因此應設計分散式訓練與推理系統,以最小化昂貴的跨區域頻寬使用。考量 GPU 的每美元效能——RTX 3090 每小時 $0.21 適用於開發與測試,擴展到 H100 每小時 $2.56 適合需要最高效能的生產工作負載。
高可用性設計:將關鍵 AI 系統部署於多個可用區或區域以實現備援。例如,在 AS-SGP-01 和 AS-SGP-02 同時託管推理端點,以確保即使其中一個可用區發生問題仍能持續提供服務。對於全球應用,可考慮跨洲部署,例如 US-CA-03、EU-GER-01 和 AS-SGP-01。在可能的情況下,將相關的 AI 工作負載(如訓練叢集、模型儲存與前處理管線)集中部署於同一可用區,以獲得最佳效能。
結論
Novita AI 擴展至所有主要大陸,並在阿聯酋、英國、印度和巴西新增區域,消除了開發者與企業構建 AI 解決方案的地理障礙。
此分佈式基礎設施降低了延遲、增強了可靠性,並能符合各地法規要求,同時提供靈活的 GPU 選擇——從每小時 $0.21 的 RTX 3090 用於開發,到每小時 $2.56 的 H100 用於企業級生產工作負載。
立即利用全球 GPU 基礎設施轉型您的 AI 專案。今天開始使用 Novita AI,將您的工作負載部署至我們的全球網路。
