Novita AI, 글로벌 GPU 인프라를 모든 주요 대륙으로 확장

Novita AI, 글로벌 GPU 인프라를 모든 주요 대륙으로 확장

AI 애플리케이션을 전 세계에 배포하는 개발자와 기업은 대기 시간을 최소화하고 비용을 절감하기 위해 접근성 높고 고성능의 GPU 인프라가 필요합니다.

Novita AI는 이제 아랍에미리트, 영국, 인도, 브라질의 4개 신규 리전을 통해 모든 주요 대륙에서 엔터프라이즈급 GPU 서비스를 제공합니다.

이 글에서는 지역별 GPU 인프라의 이점과 글로벌 배포 전략을 다룹니다.

글로벌 GPU 인프라 개요

Novita AI GPU 리소스는 전 세계 여러 위치에 호스팅됩니다. 이러한 위치는 리전과 영역으로 구성되어 기본 물리적 인프라의 논리적 추상화를 제공합니다.

리전은 영역으로 구성된 독립적인 지리적 영역이며, 리전 내 영역들은 효율적인 AI 워크로드와 데이터 전송을 지원하기 위해 고대역폭, 저지연 네트워크 연결을 제공합니다.

이제 4개의 새로운 리전이 활성화되었음을 발표하게 되어 기쁩니다:

  • 중동: 아랍에미리트 (AS-AE-01)
  • 유럽: 영국 (EU-GB-01)
  • 아시아: 인도 (AS-IN-01)
  • 남미: 브라질 (SA-BR-01)

이러한 전략적 추가는 포괄적인 글로벌 커버리지를 보장하여 고성능 GPU 컴퓨팅을 모든 주요 대륙의 개발자와 기업에 더 가깝게 제공하고, 전 세계 AI 워크로드의 지연 시간을 크게 줄입니다.

AI 워크로드를 글로벌로 배포할 준비가 되셨나요? 지금 GPU 인스턴스를 실행하고 전 세계 인프라의 성능을 경험하세요.

Novita AI의 대륙별 GPU 영역

아시아

리전 국가/위치 영역 코드 상태
인도 인도 AS-IN-01 신규
일본 도쿄 JP-TYO-01 활성
일본 도쿄 JP-TYO-02 활성
싱가포르 싱가포르 AS-SGP-01 활성
싱가포르 싱가포르 AS-SGP-02 활성
홍콩 홍콩 CN-HK-01 활성

북미

리전 국가/위치 영역 코드 상태
미국 일반 US-01 활성
미국 일반 US-02 활성
미국 캘리포니아 US-CA-02 활성
미국 캘리포니아 US-CA-03 활성
미국 캘리포니아 US-CA-06 활성

유럽

리전 국가/위치 영역 코드 상태
영국 영국 EU-GB-01 신규
독일 독일 EU-GER-01 활성
독일 독일 EU-GER-02 활성

중동

리전 국가/위치 영역 코드 상태
아랍에미리트 UAE AS-AE-01 신규

남미

리전 국가/위치 영역 코드 상태
브라질 브라질 SA-BR-01 신규

오세아니아

리전 국가/위치 영역 코드 상태
호주 호주 OC-AU-01 활성

아프리카

리전 국가/위치 영역 코드 상태
남아프리카 남아프리카 AF-ZA-01 활성

주요 GPU 인스턴스 유형 및 가격

GPU 모델 VRAM vCPU RAM 시간당 가격
H100 SXM 80GB 80 GB 22 150 GB $2.56
A100 SXM 80GB 80 GB 14 240 GB $1.60
L40S 48GB 48 GB 28 125 GB $0.55
RTX 5090 32GB 32 GB 16 120 GB $0.50
RTX 4090 24GB (고주파) 24 GB 24 58 GB $0.69
RTX 4090 24GB 24 GB 16 62 GB $0.35
RTX 3090 24GB 24 GB 16 58 GB $0.21

프로젝트에 완벽한 GPU로 시작하세요. 사용 가능한 모든 GPU 인스턴스 보기에서 최적의 구성을 선택하세요.

Novita AI는 다양한 비즈니스 요구와 사용 패턴에 맞춰 온디맨드 및 구독 GPU 가격 모델을 모두 제공합니다. 온디맨드는 시간당 종량제 결제로 최대 유연성을 제공하는 반면, 구독 요금제는 일관된 워크로드에 대해 보장된 리소스 가용성과 함께 최대 28%의 비용 절감 효과를 제공합니다.

리전 및 영역 이해하기

리전 및 영역 구성: 리전은 중복성과 부하 분산을 위해 여러 영역을 포함하는 독립적인 지리적 영역입니다. 리전 내 영역들은 효율적인 분산 AI 워크로드를 지원하기 위해 고대역폭, 저지연 네트워크 연결을 제공합니다. 영역 이름은 <region>-<identifier> 형식을 따릅니다. 예를 들어 US-CA-02, US-CA-03, US-CA-06은 모두 미국 캘리포니아 리전 내에 있지만 서로 다른 가용 영역에 있습니다.

리소스 유형: 리소스는 두 가지 범주로 나뉩니다. GPU 인스턴스 및 연결된 스토리지와 같은 영역 리소스는 특정 영역 내에 존재하며, 로드 밸런서 및 네트워크 구성과 같은 리전 리소스는 전체 리전에서 사용할 수 있습니다. 최적의 성능을 위해서는 GPU 인스턴스와 고성능 스토리지 같은 관련 리소스를 동일한 영역에 배포해야 합니다.

장애 독립성: 리전 내 여러 영역에 리소스를 분산하면 인프라 장애가 모든 리소스에 동시에 영향을 미칠 위험이 줄어듭니다. 여러 리전에 걸쳐 배포하면 훨씬 더 높은 장애 독립성을 제공하여, 리소스를 다양한 장애 도메인에 분산시킨 강력한 AI 시스템을 구현할 수 있습니다.

배포 전략 및 모범 사례

리전 선택 요소: 사용자 또는 데이터 소스에 가까운 리전을 선택하여 네트워크 지연 시간을 최소화하세요. 이는 실시간 AI 추론 애플리케이션에서 특히 중요합니다. 일부 관할권에서는 특정 데이터 처리 위치 요구 사항이 있으므로 지역 규정 준수 요구 사항을 고려하세요. 수요가 높은 GPU 유형에 따라 영역별 가용 용량이 다를 수 있으므로 GPU 가용성을 평가하세요.

비용 및 성능 최적화: 리전 내 통신은 일반적으로 리전 간 전송보다 비용 효율적이므로, 고가의 리전 간 대역폭 사용을 최소화하도록 분산 학습 및 추론 시스템을 설계하세요. GPU 가격 대비 성능 비율을 고려하세요. 개발 및 테스트용 RTX 3090($0.21/h)부터 최대 성능이 필요한 프로덕션 워크로드용 H100($2.56/h)까지 다양합니다.

고가용성 설계: 중복성을 위해 중요한 AI 시스템을 여러 영역 또는 리전에 배포하세요. 예를 들어 AS-SGP-01과 AS-SGP-02 모두에 추론 엔드포인트를 호스팅하여 한 영역에 문제가 발생해도 지속적인 가용성을 보장하세요. 글로벌 애플리케이션의 경우 US-CA-03, EU-GER-01, AS-SGP-01과 같이 여러 대륙에 걸쳐 배포하는 것을 고려하세요. 가능하면 동일한 영역에 관련 AI 워크로드를 함께 배치하세요. 훈련 클러스터, 모델 스토리지, 전처리 파이프라인은 함께 배포될 때 최적으로 작동합니다.

결론

Novita AI의 UAE, 영국, 인도, 브라질 신규 리전을 통한 모든 주요 대륙 확장은 AI 솔루션을 구축하는 개발자와 기업의 지리적 장벽을 제거합니다.

이 분산 인프라는 지연 시간을 줄이고, 신뢰성을 높이며, 지역 규정 준수를 지원하면서 개발용 RTX 3090($0.21/h)부터 엔터프라이즈 프로덕션 워크로드용 H100($2.56/h)까지 유연한 GPU 옵션을 제공합니다.

글로벌 GPU 인프라로 AI 프로젝트를 혁신하세요. 지금 Novita AI를 시작하고 전 세계 네트워크에 워크로드를 배포하세요.