Novita AI, OpenRouter에서 DeepSeek R1 API 1위 달성

DeepSeek R1이란?
Deepseek R1 하드웨어 요구 사항
클라우드 GPU 서비스를 위한 Novita AI 선택
API 서비스를 위한 Novita AI 선택
자주 묻는 질문

주요 내용

Novita AI가 DeepSeek R1 Turbo 를 출시했습니다. **3배 빠른 처리량 ** 과 **한정 기간 60% 할인 ** 을 제공하며, 이 버전은 함수 호출 을 완벽하게 지원합니다.

Novita AI에서 무료 체험을 시작하세요!

더욱 흥미로운 소식: Novita AI가 OpenRouter에서 DeepSeek R1 API 1위에 올랐습니다.

지금 DeepSeek R1 데모 사용해보기

DeepSeek R1이란?

출시일: 2025년 1월 21일
모델 규모:
주요 특징:
- 모델 크기: 671B 파라미터 (토큰당 37B 활성)
- 토크나이저: 자기 반성 태그가 포함된 향상된 토크나이저
- 지원 언어: 문화 적응이 적용된 다국어
- 멀티모달: 텍스트 전용
- 컨텍스트 윈도우: 128K 토큰
- 저장 형식: Q8/Q5 양자화 지원
- 아키텍처: Mixture of Experts (MoE) + 강화 학습 기반 학습 파이프라인
- 학습 방법: V3 베이스에 RL 파이프라인 (SFT → RL → SFT → RL) 적용
- 학습 데이터: V3 베이스 + RL 최적화 데이터

출처

벤치마크

DeepSeek-R1은 대부분의 작업에서 성능이 크게 향상되었으며, 특히 Codeforces와 GPQA Diamond 작업에서 각각 9.0%, 5.7% 향상되어 복잡한 작업 처리 능력이 뛰어남을 보여줍니다.

Deepseek R1 하드웨어 요구 사항

모델	정밀도	GPU	수량
DeepSeek-R1-Distill-Qwen-1.5B	BF16	RTX 4090	1
DeepSeek-R1-Distill-Qwen-7B	BF16	RTX 4090	1
DeepSeek-R1-Distill-Llama-8B	BF16	RTX 4090	1
DeepSeek-R1-Distill-Qwen-14B	BF16	RTX 4090	2
DeepSeek-R1-Distill-Qwen-32B	BF16	RTX 4090	4
DeepSeek-R1-Distill-Llama-70B	BF16	RTX 4090	8
DeepSeek-R1 (671B)	BF16	H100	8

DeepSeek-R1 의 하드웨어 요구 사항은 다음과 같이 명확하게 계층화되어 있습니다.

증류 모델 은 하드웨어 요구 사항이 상대적으로 낮으며, 특히 소형 및 중형 모델은 고급 소비자용 하드웨어 (예: RTX 4090)에 적합합니다.
전체 규모 모델 은 하드웨어 요구 사항이 매우 높으며, 특히 초대형 모델은 전문가용 하드웨어 (예: H100 GPU)에 의존합니다.
전반적으로 증류 기술은 하드웨어 요구 사항을 크게 낮추고 모델 배포의 유연성을 높이지만, 전체 규모 모델은 최고 성능을 발휘하려면 여전히 매우 고성능의 하드웨어가 필요합니다.

GPU 구매나 자체 배포가 너무 복잡하다고 생각되면 **Novita AI의 GPU 및 API 서비스 ** 를 사용할 수 있습니다. 이 서비스는 완전히 최적화된 버전의 DeepSeek-R1 을 제공하며, 사용이 매우 편리하고 토큰 수에 따라 요금이 부과됩니다.

클라우드 GPU 서비스를 위한 Novita AI 선택

Novita AI는 개발자가 간단한 API를 사용하여 AI 모델을 쉽게 배포할 수 있도록 지원하는 AI 클라우드 플랫폼으로, 구축 및 확장을 위한 합리적인 가격의 안정적인 GPU 클라우드도 제공합니다.

1단계: 계정 등록

Novita AI가 처음이라면 웹사이트에서 계정을 만드세요. 등록이 완료되면 “GPUs” 탭으로 이동하여 사용 가능한 리소스를 살펴보고 여정을 시작하세요.

2단계: 템플릿 및 GPU 서버 탐색

프로젝트 요구 사항에 맞는 템플릿 (예: PyTorch, TensorFlow, CUDA)을 선택하세요. 필요에 맞는 버전 (예: PyTorch 2.2.1, CUDA 11.8.0)을 선택합니다. 그런 다음 까다로운 워크로드를 처리할 수 있는 강력한 성능과 충분한 VRAM, RAM, 디스크 용량을 갖춘 A100 GPU 서버 구성을 선택합니다.

Novita AI의 고성능 GPU 사용해보기

3단계: 배포 맞춤 설정

템플릿과 GPU를 선택한 후 운영 체제 버전 (예: CUDA 11.8)과 같은 매개변수를 조정하여 배포 설정을 사용자 지정합니다. 프로젝트의 특정 요구 사항에 맞게 다른 구성도 조정할 수 있습니다.

4단계: 인스턴스 시작

템플릿과 배포 설정을 최종 결정한 후 "Launch Instance"를 클릭하여 GPU 인스턴스를 설정합니다. 그러면 환경 설정이 시작되어 AI 작업에 GPU 리소스를 사용할 수 있습니다.

API 서비스를 위한 Novita AI 선택

1단계: 로그인 및 모델 라이브러리 접속

계정에 로그인하고 Model Library 버튼을 클릭합니다.

지금 DeepSeek R1 데모 사용해보기

2단계: 모델 선택

사용 가능한 옵션을 살펴보고 필요에 맞는 모델을 선택합니다.

3단계: 무료 체험 시작

선택한 모델의 기능을 살펴보기 위해 무료 체험을 시작합니다.

4단계: API 키 받기

API 인증을 위해 새 API 키를 제공합니다. “Settings” 페이지로 이동하여 이미지에 표시된 대로 API 키를 복사할 수 있습니다.

5단계: API 설치

프로그래밍 언어에 맞는 패키지 관리자를 사용하여 API를 설치합니다.

설치 후 개발 환경에 필요한 라이브러리를 가져옵니다. API 키로 클라이언트를 초기화하여 Novita AI LLM과 상호 작용을 시작합니다. 다음은 Python 사용자를 위한 채팅 완성 API 사용 예시입니다.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="&lt;YOUR Novita AI API Key&gt;",
)

model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Novita AI는 DeepSeek R1 Turbo 로 AI 배포에 혁신을 일으키며, **3배 빠른 처리량 ** 과 **함수 호출 ** 과 같은 고급 기능을 지원하며, 현재 **한정 기간 20% 할인 ** 을 제공합니다. RTX 4090 과 같은 소비자용 GPU에서 증류 모델을 실행하든, 엔터프라이즈급 H100 GPU 로 전체 규모 모델을 배포하든, Novita AI는 비교할 수 없는 유연성을 제공합니다. 번거로움 없는 솔루션을 원한다면 **Novita AI의 GPU 및 API 서비스 ** 는 완전히 최적화된 버전의 DeepSeek R1 Turbo 와 **토큰 기반 가격 ** 및 ** 무료 체험 **을 제공합니다. DeepSeek R1 Turbo 로 차세대 AI 성능을 경험해보세요 — 지금 Novita AI 로 시작하세요!

자주 묻는 질문

DeepSeek R1 Turbo란 무엇인가요?

DeepSeek R1 Turbo는 DeepSeek R1의 최적화된 버전으로, **3배 빠른 처리량 , 함수 호출 완벽 지원, 그리고 Novita AI에서 ** 한정 기간 20% 할인을 제공합니다!

DeepSeek R1을 실행하는 데 필요한 하드웨어는 무엇인가요?

**전체 규모 모델 **: 최적의 성능을 위해 H100 과 같은 엔터프라이즈급 GPU가 필요합니다.

DeepSeek R1을 무료로 사용해볼 수 있나요?

네, Novita AI는 API 플랫폼을 통해 DeepSeek R1에 대한 무료 체험 을 제공합니다.

Novita AI는 AI 야망을 실현하는 올인원 클라우드 플랫폼입니다. 통합 API, 서버리스, GPU 인스턴스 — 필요한 비용 효율적인 도구를 제공합니다. 인프라 걱정 없이 무료로 시작하여 AI 비전을 현실로 만드세요.

Novita AI, OpenRouter에서 DeepSeek R1 API 1위 달성

주요 내용

DeepSeek R1이란?

벤치마크

Deepseek R1 하드웨어 요구 사항

클라우드 GPU 서비스를 위한 Novita AI 선택

1단계: 계정 등록

2단계: 템플릿 및 GPU 서버 탐색

3단계: 배포 맞춤 설정

4단계: 인스턴스 시작

API 서비스를 위한 Novita AI 선택

1단계: 로그인 및 모델 라이브러리 접속

2단계: 모델 선택

3단계: 무료 체험 시작

4단계: API 키 받기

5단계: API 설치

자주 묻는 질문

추천 읽을거리

Product

RESOURCES

Partners

Company

주요 내용

DeepSeek R1이란?

벤치마크

Deepseek R1 하드웨어 요구 사항

클라우드 GPU 서비스를 위한 Novita AI 선택

1단계: 계정 등록

2단계: 템플릿 및 GPU 서버 탐색

3단계: 배포 맞춤 설정

4단계: 인스턴스 시작

API 서비스를 위한 Novita AI 선택

1단계: 로그인 및 모델 라이브러리 접속

2단계: 모델 선택

3단계: 무료 체험 시작

4단계: API 키 받기

5단계: API 설치

자주 묻는 질문

추천 읽을거리

관련 게시글

Product

RESOURCES

Partners

Company