DeepSeek이 두 가지 혁신적인 모델 — DeepSeek-R1-0528과 DeepSeek-R1-0528-Qwen3-8B를 출시했습니다. 이제 간편한 API를 통해 AI 모델을 쉽게 배포할 수 있는 AI 클라우드 플랫폼 Novita AI에서 이 모델들을 사용할 수 있습니다. 이 모델들은 경쟁력 있는 가격으로 뛰어난 추론 능력을 제공하며, 이전 버전보다 훨씬 향상된 성능을 보여줍니다.
Novita AI는 두 DeepSeek-R1-0528 모델을 경쟁력 있는 요금과 투명한 사용량 기반 과금 방식으로 제공합니다:
DeepSeek-R1-0528 (전체 모델):
- 입력 토큰: 백만 토큰당 $0.7
- 출력 토큰: 백만 토큰당 $2.5
DeepSeek-R1-0528-Qwen3-8B (효율적인 8B 모델):
- 입력 토큰: 백만 토큰당 $0.06
- 출력 토큰: 백만 토큰당 $0.09
DeepSeek-R1-0528이란?
DeepSeek R1 모델이 마이너 버전 업그레이드를 거쳐 현재 버전은 DeepSeek-R1-0528입니다. 이번 최신 업데이트에서 DeepSeek R1은 후학습 과정에서 더 많은 계산 리소스를 활용하고 알고리즘 최적화 메커니즘을 도입하여 추론 깊이와 추론 능력이 크게 향상되었습니다.
이 모델은 수학, 프로그래밍, 일반 논리 등 다양한 벤치마크 평가에서 뛰어난 성능을 보여줍니다. 전반적인 성능은 이제 O3 및 Gemini 2.5 Pro와 같은 선도 모델에 근접했습니다.
DeepSeek-R1-0528의 주요 개선 사항
🔹 향상된 벤치마크 성능 (수학, 코딩, 추론 과제 전반) 🔹 향상된 프론트엔드 기능 (더 나은 사용자 경험) 🔹 환각 현상 감소 (더 신뢰할 수 있는 출력) 🔹 JSON 출력 및 함수 호출 지원 (원활한 통합)
향상된 추론 깊이
이전 버전과 비교하여 업그레이드된 모델은 복잡한 추론 작업 처리에서 상당한 개선을 보입니다. 예를 들어 AIME 2025 테스트에서 모델의 정확도는 이전 버전의 70%에서 현재 버전의 87.5%로 증가했습니다.
이러한 발전은 추론 과정에서 사고 깊이가 향상된 데서 비롯됩니다. AIME 테스트 세트에서 이전 모델은 질문당 평균 12K 토큰을 사용한 반면, 새 버전은 질문당 평균 23K 토큰을 사용합니다.
업계 선도 모델 대비 경쟁력 있는 성능
DeepSeek-R1-0528은 여러 까다로운 벤치마크에서 업계 선도 모델과 비교해 뛰어난 성능을 보여줍니다.

DeepSeek-R1 vs DeepSeek-R1-0528
수학적 추론 성능
| 벤치마크 | DeepSeek R1 | DeepSeek R1-0528 | 개선 |
|---|---|---|---|
| AIME 2024 (Pass@1) | 79.8 | 91.4 | +11.6 |
| AIME 2025 (Pass@1) | 70.0 | 87.5 | +17.5 |
| HMMT 2025 (Pass@1) | 41.7 | 79.4 | +37.7 |
| CNMO 2024 (Pass@1) | 78.8 | 86.9 | +8.1 |
코딩 성능 향상
| 벤치마크 | DeepSeek R1 | DeepSeek R1-0528 | 개선 |
|---|---|---|---|
| LiveCodeBench (Pass@1) | 63.5 | 73.3 | +9.8 |
| Codeforces-Div1 (Rating) | 1530 | 1930 | +400 |
| SWE Verified (Resolved) | 49.2 | 57.6 | +8.4 |
| Aider-Polyglot (Acc.) | 53.3 | 71.6 | +18.3 |
일반 추론 작업
| 벤치마크 | DeepSeek R1 | DeepSeek R1-0528 | 개선 |
|---|---|---|---|
| MMLU-Redux (EM) | 92.9 | 93.4 | +0.5 |
| MMLU-Pro (EM) | 84.0 | 85.0 | +1.0 |
| GPQA-Diamond (Pass@1) | 71.5 | 81.0 | +9.5 |
| SimpleQA (Correct) | 30.1 | 27.8 | -2.3 |
| FRAMES (Acc.) | 82.5 | 83.0 | +0.5 |
| Humanity’s Last Exam (Pass@1) | 8.5 | 17.7 | +9.2 |
새로운 도구 통합 기능
DeepSeek-R1-0528은 함수 호출 및 도구 통합에서 향상된 기능을 도입했습니다:
- BFCL_v3_MultiTurn (Acc): 37.0%
- Tau-Bench (Pass@1): 53.5% (항공) / 63.9% (소매)
DeepSeek-R1-0528-Qwen3-8B: 컴팩트한 우수성
DeepSeek은 Qwen3 8B Base에서 DeepSeek-R1-0528-Qwen3-8B를 만들기 위해 DeepSeek-R1-0528의 사고 사슬(chain-of-thought) 추론을 증류했습니다. 이 모델은 AIME 2024에서 오픈소스 모델 중 최고 수준(SOTA)의 성능을 달성하여 Qwen3-8B보다 +10.0% 앞서고 Qwen3-235B-thinking의 성능과 일치합니다.
이는 DeepSeek-R1-0528의 사고 사슬이 추론 모델에 관한 학술 연구와 소규모 모델에 초점을 맞춘 산업 개발 모두에 중요하다는 것을 보여줍니다.
선도 모델과의 경쟁 분석
| 모델 | AIME 24 | AIME 25 | HMMT Feb 25 | GPQA Diamond | LiveCodeBench |
|---|---|---|---|---|---|
| Qwen3-235B-A22B | 85.7 | 81.5 | 62.5 | 71.1 | 66.5 |
| Qwen3-32B | 81.4 | 72.9 | - | 68.4 | - |
| Qwen3-8B | 76.0 | 67.3 | - | 62.0 | - |
| Phi-4-Reasoning-Plus-14B | 81.3 | 78.0 | 53.6 | 69.3 | - |
| Gemini-2.5-Flash-Thinking-0520 | 82.3 | 72.0 | 64.2 | 82.8 | 62.3 |
| o3-mini (medium) | 79.6 | 76.7 | 53.3 | 76.8 | 65.9 |
| DeepSeek-R1-0528-Qwen3-8B | 86.0 | 76.3 | 61.5 | 61.1 | 60.5 |
사용 개선 사항 및 기술 세부 정보
향상된 사용성 기능
이전 버전의 DeepSeek-R1과 비교하여 DeepSeek-R1-0528의 사용 권장 사항에는 다음과 같은 개선 사항이 포함됩니다:
- 시스템 프롬프트 지원: 이전 버전과 달리 이제 시스템 프롬프트를 사용하여 일관된 컨텍스트와 지침을 제공할 수 있습니다.
- 자동 사고 패턴: 수동 활성화가 필요 없습니다. 모델이 출력 시작 부분에 "\ thinking\ " 없이 자동으로 추론 기능을 활성화합니다.
DeepSeek-R1-0528-Qwen3-8B 아키텍처
DeepSeek-R1-0528-Qwen3-8B의 모델 아키텍처는 Qwen3-8B와 동일하지만 DeepSeek-R1-0528과 동일한 토크나이저 구성을 공유합니다. 이 모델은 Qwen3-8B와 동일한 방식으로 실행할 수 있지만 모든 구성 파일이 원래 Qwen3 프로젝트가 아닌 DeepSeek의 저장소에서 제공되는지 확인해야 합니다.
개발자가 Novita AI를 선택하는 이유
간소화된 AI 모델 배포
- 인프라 관리 불필요: 서버 관리가 아닌 애플리케이션 구축에 집중하세요.
- 즉시 모델 액세스: 단일 API 호출로 최첨단 모델을 배포하세요.
- 안정적인 성능: 99.9% 가동 시간을 보장하는 엔터프라이즈급 인프라.
- 전 세계 어디서나 사용 가능: 전 세계 어디서나 지연 시간이 짧은 액세스.
모든 규모에 완벽
- 빠른 프로토타이핑: 즉시 모델 액세스로 아이디어를 신속하게 테스트하세요.
- 프로덕션 준비: 프로토타입에서 프로덕션까지 원활하게 확장하세요.
- 비용 효율성: 투명한 가격 책정으로 사용한 만큼만 지불하세요.
- 엔터프라이즈 지원: 대용량 애플리케이션을 위한 전담 지원.
이상적인 사용 사례
- 수학 AI 애플리케이션: AIME 2025에서 87.5% 정확도를 달성하는 튜터링 플랫폼 구축.
- 코드 생성 도구: LiveCodeBench에서 73.3% 성공률을 자랑하는 개발 어시스턴트 제작.
- 연구 플랫폼: 업계 선도 모델과 경쟁하는 추론 모델 배포.
- 교육 소프트웨어: 단계별 문제 해결 애플리케이션 개발.
Novita AI 시작하기
- 가입 하면 몇 초 만에 $10 무료 크레딧 을 받으세요.
- DeepSeek-R1-0528 (전체 기능) 또는 DeepSeek-R1-0528-Qwen3-8B (효율적) 탐색.
- 대시보드에서 API 키 받기.
- OpenAI 호환 엔드포인트를 사용하여 첫 번째 API 호출 실행.
- 업계 최고의 추론 기능으로 빌드 시작.
Python 사용자용:
from openai import OpenAI
base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"
client = OpenAI(
base_url=base_url,
api_key=api_key,
)
stream = True # 또는 False
max_tokens = 1000
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "user",
"content": "안녕하세요!",
}
],
stream=stream,
extra_body={
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
결론
DeepSeek-R1-0528 시리즈 모델은 경쟁력 있는 가격으로 업계 최고의 성능을 제공합니다 — AIME 2024에서 91.4%, LiveCodeBench에서 73.3%를 달성하며 OpenAI-o3 및 Gemini-2.5-Pro의 기능과 견줍니다.
Novita AI의 개발자 친화적인 플랫폼을 통해 인프라 복잡성 없이 이러한 최첨단 모델에 즉시 액세스할 수 있습니다. 투명한 가격, $10 무료 크레딧, 직관적인 API를 통해 세계적 수준의 추론을 애플리케이션에 통합하는 것이 그 어느 때보다 쉬워졌습니다.
Novita AI는 개발자에게 간단한 API를 통해 AI 모델을 쉽게 배포할 수 있는 방법을 제공하는 AI 클라우드 플랫폼이며, 또한 저렴하고 안정적인 GPU 클라우드를 제공하여 구축 및 확장을 지원합니다.
