Novita AI, OpenRouter에서 DeepSeek R1 API 1위 달성

Novita AI, OpenRouter에서 DeepSeek R1 API 1위 달성

주요 내용

Novita AI가 DeepSeek R1 Turbo 를 출시했습니다. **3배 빠른 처리량 ** 과 **한정 기간 60% 할인 ** 을 제공하며, 이 버전은 함수 호출 을 완벽하게 지원합니다.

Novita AI에서 무료 체험을 시작하세요!

deepseek r1 turbo price

더욱 흥미로운 소식: Novita AI가 OpenRouter에서 DeepSeek R1 API 1위에 올랐습니다.

지금 DeepSeek R1 데모 사용해보기

DeepSeek R1이란?

r1 creation

출처

벤치마크

benchmark of deepseek r1

DeepSeek-R1은 대부분의 작업에서 성능이 크게 향상되었으며, 특히 Codeforces와 GPQA Diamond 작업에서 각각 9.0%, 5.7% 향상되어 복잡한 작업 처리 능력이 뛰어남을 보여줍니다.

Deepseek R1 하드웨어 요구 사항

모델 정밀도 GPU 수량
DeepSeek-R1-Distill-Qwen-1.5B BF16 RTX 4090 1
DeepSeek-R1-Distill-Qwen-7B BF16 RTX 4090 1
DeepSeek-R1-Distill-Llama-8B BF16 RTX 4090 1
DeepSeek-R1-Distill-Qwen-14B BF16 RTX 4090 2
DeepSeek-R1-Distill-Qwen-32B BF16 RTX 4090 4
DeepSeek-R1-Distill-Llama-70B BF16 RTX 4090 8
DeepSeek-R1 (671B) BF16 H100 8

DeepSeek-R1 의 하드웨어 요구 사항은 다음과 같이 명확하게 계층화되어 있습니다.

  • 증류 모델 은 하드웨어 요구 사항이 상대적으로 낮으며, 특히 소형 및 중형 모델은 고급 소비자용 하드웨어 (예: RTX 4090)에 적합합니다.
  • 전체 규모 모델 은 하드웨어 요구 사항이 매우 높으며, 특히 초대형 모델은 전문가용 하드웨어 (예: H100 GPU)에 의존합니다.
  • 전반적으로 증류 기술은 하드웨어 요구 사항을 크게 낮추고 모델 배포의 유연성을 높이지만, 전체 규모 모델은 최고 성능을 발휘하려면 여전히 매우 고성능의 하드웨어가 필요합니다.

GPU 구매나 자체 배포가 너무 복잡하다고 생각되면 **Novita AI의 GPU 및 API 서비스 ** 를 사용할 수 있습니다. 이 서비스는 완전히 최적화된 버전의 DeepSeek-R1 을 제공하며, 사용이 매우 편리하고 토큰 수에 따라 요금이 부과됩니다.

클라우드 GPU 서비스를 위한 Novita AI 선택

Novita AI는 개발자가 간단한 API를 사용하여 AI 모델을 쉽게 배포할 수 있도록 지원하는 AI 클라우드 플랫폼으로, 구축 및 확장을 위한 합리적인 가격의 안정적인 GPU 클라우드도 제공합니다.

1단계: 계정 등록

Novita AI가 처음이라면 웹사이트에서 계정을 만드세요. 등록이 완료되면 “GPUs” 탭으로 이동하여 사용 가능한 리소스를 살펴보고 여정을 시작하세요.

Novita AI website screenshot

2단계: 템플릿 및 GPU 서버 탐색

프로젝트 요구 사항에 맞는 템플릿 (예: PyTorch, TensorFlow, CUDA)을 선택하세요. 필요에 맞는 버전 (예: PyTorch 2.2.1, CUDA 11.8.0)을 선택합니다. 그런 다음 까다로운 워크로드를 처리할 수 있는 강력한 성능과 충분한 VRAM, RAM, 디스크 용량을 갖춘 A100 GPU 서버 구성을 선택합니다.

novita ai website screenshot using cloud gpu

Novita AI의 고성능 GPU 사용해보기

3단계: 배포 맞춤 설정

템플릿과 GPU를 선택한 후 운영 체제 버전 (예: CUDA 11.8)과 같은 매개변수를 조정하여 배포 설정을 사용자 지정합니다. 프로젝트의 특정 요구 사항에 맞게 다른 구성도 조정할 수 있습니다.

novita ai website screenshot using cloud gpu

4단계: 인스턴스 시작

템플릿과 배포 설정을 최종 결정한 후 "Launch Instance"를 클릭하여 GPU 인스턴스를 설정합니다. 그러면 환경 설정이 시작되어 AI 작업에 GPU 리소스를 사용할 수 있습니다.

novita ai website screenshot using cloud gpu

API 서비스를 위한 Novita AI 선택

Novita AI는 개발자가 간단한 API를 사용하여 AI 모델을 쉽게 배포할 수 있도록 지원하는 AI 클라우드 플랫폼으로, 구축 및 확장을 위한 합리적인 가격의 안정적인 GPU 클라우드도 제공합니다.

1단계: 로그인 및 모델 라이브러리 접속

계정에 로그인하고 Model Library 버튼을 클릭합니다.

Log In and Access the Model Library

지금 DeepSeek R1 데모 사용해보기

2단계: 모델 선택

사용 가능한 옵션을 살펴보고 필요에 맞는 모델을 선택합니다.

3단계: 무료 체험 시작

선택한 모델의 기능을 살펴보기 위해 무료 체험을 시작합니다.

start a free trail

4단계: API 키 받기

API 인증을 위해 새 API 키를 제공합니다. “Settings” 페이지로 이동하여 이미지에 표시된 대로 API 키를 복사할 수 있습니다.

get api key

5단계: API 설치

프로그래밍 언어에 맞는 패키지 관리자를 사용하여 API를 설치합니다.

install api

설치 후 개발 환경에 필요한 라이브러리를 가져옵니다. API 키로 클라이언트를 초기화하여 Novita AI LLM과 상호 작용을 시작합니다. 다음은 Python 사용자를 위한 채팅 완성 API 사용 예시입니다.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Novita AI는 DeepSeek R1 Turbo 로 AI 배포에 혁신을 일으키며, **3배 빠른 처리량 ** 과 **함수 호출 ** 과 같은 고급 기능을 지원하며, 현재 **한정 기간 20% 할인 ** 을 제공합니다. RTX 4090 과 같은 소비자용 GPU에서 증류 모델을 실행하든, 엔터프라이즈급 H100 GPU 로 전체 규모 모델을 배포하든, Novita AI는 비교할 수 없는 유연성을 제공합니다. 번거로움 없는 솔루션을 원한다면 **Novita AI의 GPU 및 API 서비스 ** 는 완전히 최적화된 버전의 DeepSeek R1 Turbo 와 **토큰 기반 가격 ** 및 ** 무료 체험 **을 제공합니다. DeepSeek R1 Turbo 로 차세대 AI 성능을 경험해보세요 — 지금 Novita AI 로 시작하세요!

자주 묻는 질문

DeepSeek R1 Turbo란 무엇인가요?

DeepSeek R1 Turbo는 DeepSeek R1의 최적화된 버전으로, **3배 빠른 처리량 , 함수 호출 완벽 지원, 그리고 Novita AI에서 ** 한정 기간 20% 할인을 제공합니다!

DeepSeek R1을 실행하는 데 필요한 하드웨어는 무엇인가요?

**전체 규모 모델 **: 최적의 성능을 위해 H100 과 같은 엔터프라이즈급 GPU가 필요합니다.

DeepSeek R1을 무료로 사용해볼 수 있나요?

네, Novita AI는 API 플랫폼을 통해 DeepSeek R1에 대한 무료 체험 을 제공합니다.

Novita AI는 AI 야망을 실현하는 올인원 클라우드 플랫폼입니다. 통합 API, 서버리스, GPU 인스턴스 — 필요한 비용 효율적인 도구를 제공합니다. 인프라 걱정 없이 무료로 시작하여 AI 비전을 현실로 만드세요.

추천 읽을거리