주요 내용
Novita AI가 DeepSeek R1 Turbo 를 출시했습니다. **3배 빠른 처리량 ** 과 **한정 기간 60% 할인 ** 을 제공하며, 이 버전은 함수 호출 을 완벽하게 지원합니다.
Novita AI에서 무료 체험을 시작하세요!

더욱 흥미로운 소식: Novita AI가 OpenRouter에서 DeepSeek R1 API 1위에 올랐습니다.

DeepSeek R1이란?
- 출시일: 2025년 1월 21일
- 모델 규모:
- 주요 특징:
- 모델 크기: 671B 파라미터 (토큰당 37B 활성)
- 토크나이저: 자기 반성 태그가 포함된 향상된 토크나이저
- 지원 언어: 문화 적응이 적용된 다국어
- 멀티모달: 텍스트 전용
- 컨텍스트 윈도우: 128K 토큰
- 저장 형식: Q8/Q5 양자화 지원
- 아키텍처: Mixture of Experts (MoE) + 강화 학습 기반 학습 파이프라인
- 학습 방법: V3 베이스에 RL 파이프라인 (SFT → RL → SFT → RL) 적용
- 학습 데이터: V3 베이스 + RL 최적화 데이터

벤치마크

DeepSeek-R1은 대부분의 작업에서 성능이 크게 향상되었으며, 특히 Codeforces와 GPQA Diamond 작업에서 각각 9.0%, 5.7% 향상되어 복잡한 작업 처리 능력이 뛰어남을 보여줍니다.
Deepseek R1 하드웨어 요구 사항
| 모델 | 정밀도 | GPU | 수량 |
|---|---|---|---|
| DeepSeek-R1-Distill-Qwen-1.5B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-7B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Llama-8B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-14B | BF16 | RTX 4090 | 2 |
| DeepSeek-R1-Distill-Qwen-32B | BF16 | RTX 4090 | 4 |
| DeepSeek-R1-Distill-Llama-70B | BF16 | RTX 4090 | 8 |
| DeepSeek-R1 (671B) | BF16 | H100 | 8 |
DeepSeek-R1 의 하드웨어 요구 사항은 다음과 같이 명확하게 계층화되어 있습니다.
- 증류 모델 은 하드웨어 요구 사항이 상대적으로 낮으며, 특히 소형 및 중형 모델은 고급 소비자용 하드웨어 (예: RTX 4090)에 적합합니다.
- 전체 규모 모델 은 하드웨어 요구 사항이 매우 높으며, 특히 초대형 모델은 전문가용 하드웨어 (예: H100 GPU)에 의존합니다.
- 전반적으로 증류 기술은 하드웨어 요구 사항을 크게 낮추고 모델 배포의 유연성을 높이지만, 전체 규모 모델은 최고 성능을 발휘하려면 여전히 매우 고성능의 하드웨어가 필요합니다.
GPU 구매나 자체 배포가 너무 복잡하다고 생각되면 **Novita AI의 GPU 및 API 서비스 ** 를 사용할 수 있습니다. 이 서비스는 완전히 최적화된 버전의 DeepSeek-R1 을 제공하며, 사용이 매우 편리하고 토큰 수에 따라 요금이 부과됩니다.
클라우드 GPU 서비스를 위한 Novita AI 선택
Novita AI는 개발자가 간단한 API를 사용하여 AI 모델을 쉽게 배포할 수 있도록 지원하는 AI 클라우드 플랫폼으로, 구축 및 확장을 위한 합리적인 가격의 안정적인 GPU 클라우드도 제공합니다.
1단계: 계정 등록
Novita AI가 처음이라면 웹사이트에서 계정을 만드세요. 등록이 완료되면 “GPUs” 탭으로 이동하여 사용 가능한 리소스를 살펴보고 여정을 시작하세요.

2단계: 템플릿 및 GPU 서버 탐색
프로젝트 요구 사항에 맞는 템플릿 (예: PyTorch, TensorFlow, CUDA)을 선택하세요. 필요에 맞는 버전 (예: PyTorch 2.2.1, CUDA 11.8.0)을 선택합니다. 그런 다음 까다로운 워크로드를 처리할 수 있는 강력한 성능과 충분한 VRAM, RAM, 디스크 용량을 갖춘 A100 GPU 서버 구성을 선택합니다.

3단계: 배포 맞춤 설정
템플릿과 GPU를 선택한 후 운영 체제 버전 (예: CUDA 11.8)과 같은 매개변수를 조정하여 배포 설정을 사용자 지정합니다. 프로젝트의 특정 요구 사항에 맞게 다른 구성도 조정할 수 있습니다.

4단계: 인스턴스 시작
템플릿과 배포 설정을 최종 결정한 후 "Launch Instance"를 클릭하여 GPU 인스턴스를 설정합니다. 그러면 환경 설정이 시작되어 AI 작업에 GPU 리소스를 사용할 수 있습니다.

API 서비스를 위한 Novita AI 선택
Novita AI는 개발자가 간단한 API를 사용하여 AI 모델을 쉽게 배포할 수 있도록 지원하는 AI 클라우드 플랫폼으로, 구축 및 확장을 위한 합리적인 가격의 안정적인 GPU 클라우드도 제공합니다.
1단계: 로그인 및 모델 라이브러리 접속
계정에 로그인하고 Model Library 버튼을 클릭합니다.

2단계: 모델 선택
사용 가능한 옵션을 살펴보고 필요에 맞는 모델을 선택합니다.

3단계: 무료 체험 시작
선택한 모델의 기능을 살펴보기 위해 무료 체험을 시작합니다.

4단계: API 키 받기
API 인증을 위해 새 API 키를 제공합니다. “Settings” 페이지로 이동하여 이미지에 표시된 대로 API 키를 복사할 수 있습니다.

5단계: API 설치
프로그래밍 언어에 맞는 패키지 관리자를 사용하여 API를 설치합니다.

설치 후 개발 환경에 필요한 라이브러리를 가져옵니다. API 키로 클라이언트를 초기화하여 Novita AI LLM과 상호 작용을 시작합니다. 다음은 Python 사용자를 위한 채팅 완성 API 사용 예시입니다.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Novita AI는 DeepSeek R1 Turbo 로 AI 배포에 혁신을 일으키며, **3배 빠른 처리량 ** 과 **함수 호출 ** 과 같은 고급 기능을 지원하며, 현재 **한정 기간 20% 할인 ** 을 제공합니다. RTX 4090 과 같은 소비자용 GPU에서 증류 모델을 실행하든, 엔터프라이즈급 H100 GPU 로 전체 규모 모델을 배포하든, Novita AI는 비교할 수 없는 유연성을 제공합니다. 번거로움 없는 솔루션을 원한다면 **Novita AI의 GPU 및 API 서비스 ** 는 완전히 최적화된 버전의 DeepSeek R1 Turbo 와 **토큰 기반 가격 ** 및 ** 무료 체험 **을 제공합니다. DeepSeek R1 Turbo 로 차세대 AI 성능을 경험해보세요 — 지금 Novita AI 로 시작하세요!
자주 묻는 질문
DeepSeek R1 Turbo란 무엇인가요?
DeepSeek R1 Turbo는 DeepSeek R1의 최적화된 버전으로, **3배 빠른 처리량 , 함수 호출 완벽 지원, 그리고 Novita AI에서 ** 한정 기간 20% 할인을 제공합니다!
DeepSeek R1을 실행하는 데 필요한 하드웨어는 무엇인가요?
**전체 규모 모델 **: 최적의 성능을 위해 H100 과 같은 엔터프라이즈급 GPU가 필요합니다.
DeepSeek R1을 무료로 사용해볼 수 있나요?
네, Novita AI는 API 플랫폼을 통해 DeepSeek R1에 대한 무료 체험 을 제공합니다.
Novita AI는 AI 야망을 실현하는 올인원 클라우드 플랫폼입니다. 통합 API, 서버리스, GPU 인스턴스 — 필요한 비용 효율적인 도구를 제공합니다. 인프라 걱정 없이 무료로 시작하여 AI 비전을 현실로 만드세요.
