Novita AI 扩展全球GPU基础设施,覆盖所有主要大洲

Novita AI 扩展全球GPU基础设施,覆盖所有主要大洲

全球范围内部署 AI 应用的开发者和企业需要可访问、高性能的 GPU 基础设施,以最大限度地降低延迟和成本。

Novita AI 现已在所有主要大洲提供企业级 GPU 服务,新增四个区域:阿联酋、英国、印度和巴西。

本文介绍区域 GPU 基础设施的优势及全球部署策略。

全球 GPU 基础设施概览

Novita AI GPU 资源托管在全球多个地点。这些地点由区域和可用区组成,是对底层物理基础设施的逻辑抽象。

区域是包含多个可用区的独立地理区域。同一区域内的可用区之间通过高带宽、低延迟的网络连接,以支持高效的 AI 工作负载和数据传输。

我们很高兴地宣布四个新区域现已上线:

  • 中东:阿联酋 (AS-AE-01)
  • 欧洲:英国 (EU-GB-01)
  • 亚洲:印度 (AS-IN-01)
  • 南美洲:巴西 (SA-BR-01)

这些战略性新增区域确保了全面的全球覆盖,将高性能 GPU 计算资源更贴近全球各大洲的开发者和企业,显著降低 AI 工作负载的延迟。

准备好全球部署您的 AI 工作负载了吗?立即启动您的 GPU 实例,体验我们全球基础设施的强大能力。

Novita AI 各大洲 GPU 可用区

亚洲

区域 国家/地点 可用区代码 状态
印度 印度 AS-IN-01 新增
日本 东京 JP-TYO-01 活跃
日本 东京 JP-TYO-02 活跃
新加坡 新加坡 AS-SGP-01 活跃
新加坡 新加坡 AS-SGP-02 活跃
香港 香港 CN-HK-01 活跃

北美洲

区域 国家/地点 可用区代码 状态
美国 通用 US-01 活跃
美国 通用 US-02 活跃
美国 加利福尼亚 US-CA-02 活跃
美国 加利福尼亚 US-CA-03 活跃
美国 加利福尼亚 US-CA-06 活跃

欧洲

区域 国家/地点 可用区代码 状态
英国 英国 EU-GB-01 新增
德国 德国 EU-GER-01 活跃
德国 德国 EU-GER-02 活跃

中东

区域 国家/地点 可用区代码 状态
阿联酋 阿联酋 AS-AE-01 新增

南美洲

区域 国家/地点 可用区代码 状态
巴西 巴西 SA-BR-01 新增

大洋洲

区域 国家/地点 可用区代码 状态
澳大利亚 澳大利亚 OC-AU-01 活跃

非洲

区域 国家/地点 可用区代码 状态
南非 南非 AF-ZA-01 活跃

主要 GPU 实例类型与定价

GPU 型号 显存 vCPU 内存 价格/小时
H100 SXM 80GB 80 GB 22 150 GB $2.56
A100 SXM 80GB 80 GB 14 240 GB $1.60
L40S 48GB 48 GB 28 125 GB $0.55
RTX 5090 32GB 32 GB 16 120 GB $0.50
RTX 4090 24GB (高频) 24 GB 24 58 GB $0.69
RTX 4090 24GB 24 GB 16 62 GB $0.35
RTX 3090 24GB 24 GB 16 58 GB $0.21

从适合您项目的完美 GPU 开始。浏览所有可用 GPU 实例,选择您的最佳配置。

Novita AI 提供按需和 订阅 GPU 定价模式 以满足不同的业务需求和使用模式。按需模式以按小时付费的方式提供最大灵活性,而订阅计划可为稳定工作负载提供高达 28% 的成本节省,并保证资源可用性。

理解区域和可用区

区域与可用区组织:区域是独立的 geographic 区域,包含多个可用区以实现冗余和负载分布。同一区域内的可用区之间通过高带宽、低延迟的网络连接,以支持高效的分布式 AI 工作负载。可用区名称采用 <区域>-<标识符> 格式——例如,US-CA-02、US-CA-03 和 US-CA-06 都属于美国加利福尼亚区域,但位于不同的可用区。

资源类型:资源分为两类——区域级资源(如 GPU 实例和附加存储)存在于特定可用区内;区域级资源(如负载均衡器和网络配置)可在整个区域内使用。为获得最佳性能,相关资源(如 GPU 实例和高性能存储)必须部署在同一个可用区。

故障独立性:将资源分布在同一区域内的不同可用区,可降低基础设施故障同时影响所有资源的风险。跨不同区域部署可实现更高的故障独立性,使资源分布在不同的故障域中,从而构建稳健的 AI 系统。

部署策略与最佳实践

区域选择因素:根据用户或数据源的 proximity 选择区域,以最小化网络延迟,这对实时 AI 推理应用尤为关键。考虑区域合规性要求,因为某些管辖区有特定的数据处理地点规定。评估 GPU 可用性,因为不同可用区对高需求 GPU 类型的容量可能不同。

成本与性能优化:区域内通信通常比跨区域传输更具成本效益,因此应设计分布式训练和推理系统,尽量减少昂贵的跨区域带宽使用。考虑 GPU 性价比——RTX 3090 每小时 $0.21 用于开发和测试,扩展至 H100 每小时 $2.56 用于需要最高性能的生产工作负载。

高可用性设计:将关键 AI 系统部署到多个可用区或区域以实现冗余。例如,在 AS-SGP-01 和 AS-SGP-02 同时托管推理端点,确保即使一个可用区出现问题也能持续可用。对于全球应用,考虑跨大洲部署,如 US-CA-03、EU-GER-01 和 AS-SGP-01。尽可能将相关 AI 工作负载部署在同一个可用区——训练集群、模型存储和预处理流水线在共同部署时性能最佳。

结论

Novita AI 扩展至所有主要大洲,新增阿联酋、英国、印度和巴西区域,消除了开发者和企业构建 AI 解决方案的地理障碍。

这种分布式基础设施可降低延迟、增强可靠性、实现区域合规性,同时提供灵活的 GPU 选项——从每小时 $0.21 的 RTX 3090(用于开发)到每小时 $2.56 的 H100(用于企业生产工作负载)。

利用全球 GPU 基础设施实现您的 AI 项目转型。立即开始使用 Novita AI,将您的工作负载部署到我们的全球网络中。