全球范围内部署 AI 应用的开发者和企业需要可访问、高性能的 GPU 基础设施,以最大限度地降低延迟和成本。
Novita AI 现已在所有主要大洲提供企业级 GPU 服务,新增四个区域:阿联酋、英国、印度和巴西。
本文介绍区域 GPU 基础设施的优势及全球部署策略。
全球 GPU 基础设施概览
Novita AI GPU 资源托管在全球多个地点。这些地点由区域和可用区组成,是对底层物理基础设施的逻辑抽象。
区域是包含多个可用区的独立地理区域。同一区域内的可用区之间通过高带宽、低延迟的网络连接,以支持高效的 AI 工作负载和数据传输。
我们很高兴地宣布四个新区域现已上线:
- 中东:阿联酋 (AS-AE-01)
- 欧洲:英国 (EU-GB-01)
- 亚洲:印度 (AS-IN-01)
- 南美洲:巴西 (SA-BR-01)
这些战略性新增区域确保了全面的全球覆盖,将高性能 GPU 计算资源更贴近全球各大洲的开发者和企业,显著降低 AI 工作负载的延迟。
准备好全球部署您的 AI 工作负载了吗?立即启动您的 GPU 实例,体验我们全球基础设施的强大能力。
Novita AI 各大洲 GPU 可用区
亚洲
| 区域 | 国家/地点 | 可用区代码 | 状态 |
|---|---|---|---|
| 印度 | 印度 | AS-IN-01 | 新增 |
| 日本 | 东京 | JP-TYO-01 | 活跃 |
| 日本 | 东京 | JP-TYO-02 | 活跃 |
| 新加坡 | 新加坡 | AS-SGP-01 | 活跃 |
| 新加坡 | 新加坡 | AS-SGP-02 | 活跃 |
| 香港 | 香港 | CN-HK-01 | 活跃 |
北美洲
| 区域 | 国家/地点 | 可用区代码 | 状态 |
|---|---|---|---|
| 美国 | 通用 | US-01 | 活跃 |
| 美国 | 通用 | US-02 | 活跃 |
| 美国 | 加利福尼亚 | US-CA-02 | 活跃 |
| 美国 | 加利福尼亚 | US-CA-03 | 活跃 |
| 美国 | 加利福尼亚 | US-CA-06 | 活跃 |
欧洲
| 区域 | 国家/地点 | 可用区代码 | 状态 |
|---|---|---|---|
| 英国 | 英国 | EU-GB-01 | 新增 |
| 德国 | 德国 | EU-GER-01 | 活跃 |
| 德国 | 德国 | EU-GER-02 | 活跃 |
中东
| 区域 | 国家/地点 | 可用区代码 | 状态 |
|---|---|---|---|
| 阿联酋 | 阿联酋 | AS-AE-01 | 新增 |
南美洲
| 区域 | 国家/地点 | 可用区代码 | 状态 |
|---|---|---|---|
| 巴西 | 巴西 | SA-BR-01 | 新增 |
大洋洲
| 区域 | 国家/地点 | 可用区代码 | 状态 |
|---|---|---|---|
| 澳大利亚 | 澳大利亚 | OC-AU-01 | 活跃 |
非洲
| 区域 | 国家/地点 | 可用区代码 | 状态 |
|---|---|---|---|
| 南非 | 南非 | AF-ZA-01 | 活跃 |
主要 GPU 实例类型与定价
| GPU 型号 | 显存 | vCPU | 内存 | 价格/小时 |
|---|---|---|---|---|
| H100 SXM 80GB | 80 GB | 22 | 150 GB | $2.56 |
| A100 SXM 80GB | 80 GB | 14 | 240 GB | $1.60 |
| L40S 48GB | 48 GB | 28 | 125 GB | $0.55 |
| RTX 5090 32GB | 32 GB | 16 | 120 GB | $0.50 |
| RTX 4090 24GB (高频) | 24 GB | 24 | 58 GB | $0.69 |
| RTX 4090 24GB | 24 GB | 16 | 62 GB | $0.35 |
| RTX 3090 24GB | 24 GB | 16 | 58 GB | $0.21 |
从适合您项目的完美 GPU 开始。浏览所有可用 GPU 实例,选择您的最佳配置。
Novita AI 提供按需和 订阅 GPU 定价模式 以满足不同的业务需求和使用模式。按需模式以按小时付费的方式提供最大灵活性,而订阅计划可为稳定工作负载提供高达 28% 的成本节省,并保证资源可用性。
理解区域和可用区
区域与可用区组织:区域是独立的 geographic 区域,包含多个可用区以实现冗余和负载分布。同一区域内的可用区之间通过高带宽、低延迟的网络连接,以支持高效的分布式 AI 工作负载。可用区名称采用 <区域>-<标识符> 格式——例如,US-CA-02、US-CA-03 和 US-CA-06 都属于美国加利福尼亚区域,但位于不同的可用区。
资源类型:资源分为两类——区域级资源(如 GPU 实例和附加存储)存在于特定可用区内;区域级资源(如负载均衡器和网络配置)可在整个区域内使用。为获得最佳性能,相关资源(如 GPU 实例和高性能存储)必须部署在同一个可用区。
故障独立性:将资源分布在同一区域内的不同可用区,可降低基础设施故障同时影响所有资源的风险。跨不同区域部署可实现更高的故障独立性,使资源分布在不同的故障域中,从而构建稳健的 AI 系统。
部署策略与最佳实践
区域选择因素:根据用户或数据源的 proximity 选择区域,以最小化网络延迟,这对实时 AI 推理应用尤为关键。考虑区域合规性要求,因为某些管辖区有特定的数据处理地点规定。评估 GPU 可用性,因为不同可用区对高需求 GPU 类型的容量可能不同。
成本与性能优化:区域内通信通常比跨区域传输更具成本效益,因此应设计分布式训练和推理系统,尽量减少昂贵的跨区域带宽使用。考虑 GPU 性价比——RTX 3090 每小时 $0.21 用于开发和测试,扩展至 H100 每小时 $2.56 用于需要最高性能的生产工作负载。
高可用性设计:将关键 AI 系统部署到多个可用区或区域以实现冗余。例如,在 AS-SGP-01 和 AS-SGP-02 同时托管推理端点,确保即使一个可用区出现问题也能持续可用。对于全球应用,考虑跨大洲部署,如 US-CA-03、EU-GER-01 和 AS-SGP-01。尽可能将相关 AI 工作负载部署在同一个可用区——训练集群、模型存储和预处理流水线在共同部署时性能最佳。
结论
Novita AI 扩展至所有主要大洲,新增阿联酋、英国、印度和巴西区域,消除了开发者和企业构建 AI 解决方案的地理障碍。
这种分布式基础设施可降低延迟、增强可靠性、实现区域合规性,同时提供灵活的 GPU 选项——从每小时 $0.21 的 RTX 3090(用于开发)到每小时 $2.56 的 H100(用于企业生产工作负载)。
利用全球 GPU 基础设施实现您的 AI 项目转型。立即开始使用 Novita AI,将您的工作负载部署到我们的全球网络中。
