DeepSeek-R1-0528 및 DeepSeek-R1-0528-Qwen3-8B 이제 Novita AI에서 사용 가능

DeepSeek-R1-0528 및 DeepSeek-R1-0528-Qwen3-8B 이제 Novita AI에서 사용 가능

DeepSeek이 두 가지 혁신적인 모델 — DeepSeek-R1-0528과 DeepSeek-R1-0528-Qwen3-8B를 출시했습니다. 이제 간편한 API를 통해 AI 모델을 쉽게 배포할 수 있는 AI 클라우드 플랫폼 Novita AI에서 이 모델들을 사용할 수 있습니다. 이 모델들은 경쟁력 있는 가격으로 뛰어난 추론 능력을 제공하며, 이전 버전보다 훨씬 향상된 성능을 보여줍니다.

Novita AI는 두 DeepSeek-R1-0528 모델을 경쟁력 있는 요금과 투명한 사용량 기반 과금 방식으로 제공합니다:

DeepSeek-R1-0528 (전체 모델):

  • 입력 토큰: 백만 토큰당 $0.7
  • 출력 토큰: 백만 토큰당 $2.5

DeepSeek-R1-0528-Qwen3-8B (효율적인 8B 모델):

  • 입력 토큰: 백만 토큰당 $0.06
  • 출력 토큰: 백만 토큰당 $0.09

DeepSeek-R1-0528 데모 사용해보기

DeepSeek-R1-0528이란?

DeepSeek R1 모델이 마이너 버전 업그레이드를 거쳐 현재 버전은 DeepSeek-R1-0528입니다. 이번 최신 업데이트에서 DeepSeek R1은 후학습 과정에서 더 많은 계산 리소스를 활용하고 알고리즘 최적화 메커니즘을 도입하여 추론 깊이와 추론 능력이 크게 향상되었습니다.

이 모델은 수학, 프로그래밍, 일반 논리 등 다양한 벤치마크 평가에서 뛰어난 성능을 보여줍니다. 전반적인 성능은 이제 O3 및 Gemini 2.5 Pro와 같은 선도 모델에 근접했습니다.

DeepSeek-R1-0528의 주요 개선 사항

🔹 향상된 벤치마크 성능 (수학, 코딩, 추론 과제 전반) 🔹 향상된 프론트엔드 기능 (더 나은 사용자 경험) 🔹 환각 현상 감소 (더 신뢰할 수 있는 출력) 🔹 JSON 출력 및 함수 호출 지원 (원활한 통합)

향상된 추론 깊이

이전 버전과 비교하여 업그레이드된 모델은 복잡한 추론 작업 처리에서 상당한 개선을 보입니다. 예를 들어 AIME 2025 테스트에서 모델의 정확도는 이전 버전의 70%에서 현재 버전의 87.5%로 증가했습니다.

이러한 발전은 추론 과정에서 사고 깊이가 향상된 데서 비롯됩니다. AIME 테스트 세트에서 이전 모델은 질문당 평균 12K 토큰을 사용한 반면, 새 버전은 질문당 평균 23K 토큰을 사용합니다.

업계 선도 모델 대비 경쟁력 있는 성능

DeepSeek-R1-0528은 여러 까다로운 벤치마크에서 업계 선도 모델과 비교해 뛰어난 성능을 보여줍니다.

deepseek r1 0528 benchmark

DeepSeek-R1 vs DeepSeek-R1-0528

수학적 추론 성능

벤치마크 DeepSeek R1 DeepSeek R1-0528 개선
AIME 2024 (Pass@1) 79.8 91.4 +11.6
AIME 2025 (Pass@1) 70.0 87.5 +17.5
HMMT 2025 (Pass@1) 41.7 79.4 +37.7
CNMO 2024 (Pass@1) 78.8 86.9 +8.1

코딩 성능 향상

벤치마크 DeepSeek R1 DeepSeek R1-0528 개선
LiveCodeBench (Pass@1) 63.5 73.3 +9.8
Codeforces-Div1 (Rating) 1530 1930 +400
SWE Verified (Resolved) 49.2 57.6 +8.4
Aider-Polyglot (Acc.) 53.3 71.6 +18.3

일반 추론 작업

벤치마크 DeepSeek R1 DeepSeek R1-0528 개선
MMLU-Redux (EM) 92.9 93.4 +0.5
MMLU-Pro (EM) 84.0 85.0 +1.0
GPQA-Diamond (Pass@1) 71.5 81.0 +9.5
SimpleQA (Correct) 30.1 27.8 -2.3
FRAMES (Acc.) 82.5 83.0 +0.5
Humanity’s Last Exam (Pass@1) 8.5 17.7 +9.2

새로운 도구 통합 기능

DeepSeek-R1-0528은 함수 호출 및 도구 통합에서 향상된 기능을 도입했습니다:

  • BFCL_v3_MultiTurn (Acc): 37.0%
  • Tau-Bench (Pass@1): 53.5% (항공) / 63.9% (소매)

DeepSeek-R1-0528-Qwen3-8B: 컴팩트한 우수성

DeepSeek은 Qwen3 8B Base에서 DeepSeek-R1-0528-Qwen3-8B를 만들기 위해 DeepSeek-R1-0528의 사고 사슬(chain-of-thought) 추론을 증류했습니다. 이 모델은 AIME 2024에서 오픈소스 모델 중 최고 수준(SOTA)의 성능을 달성하여 Qwen3-8B보다 +10.0% 앞서고 Qwen3-235B-thinking의 성능과 일치합니다.

이는 DeepSeek-R1-0528의 사고 사슬이 추론 모델에 관한 학술 연구와 소규모 모델에 초점을 맞춘 산업 개발 모두에 중요하다는 것을 보여줍니다.

선도 모델과의 경쟁 분석

모델 AIME 24 AIME 25 HMMT Feb 25 GPQA Diamond LiveCodeBench
Qwen3-235B-A22B 85.7 81.5 62.5 71.1 66.5
Qwen3-32B 81.4 72.9 - 68.4 -
Qwen3-8B 76.0 67.3 - 62.0 -
Phi-4-Reasoning-Plus-14B 81.3 78.0 53.6 69.3 -
Gemini-2.5-Flash-Thinking-0520 82.3 72.0 64.2 82.8 62.3
o3-mini (medium) 79.6 76.7 53.3 76.8 65.9
DeepSeek-R1-0528-Qwen3-8B 86.0 76.3 61.5 61.1 60.5

사용 개선 사항 및 기술 세부 정보

향상된 사용성 기능

이전 버전의 DeepSeek-R1과 비교하여 DeepSeek-R1-0528의 사용 권장 사항에는 다음과 같은 개선 사항이 포함됩니다:

  • 시스템 프롬프트 지원: 이전 버전과 달리 이제 시스템 프롬프트를 사용하여 일관된 컨텍스트와 지침을 제공할 수 있습니다.
  • 자동 사고 패턴: 수동 활성화가 필요 없습니다. 모델이 출력 시작 부분에 "\ thinking\ " 없이 자동으로 추론 기능을 활성화합니다.

DeepSeek-R1-0528-Qwen3-8B 아키텍처

DeepSeek-R1-0528-Qwen3-8B의 모델 아키텍처는 Qwen3-8B와 동일하지만 DeepSeek-R1-0528과 동일한 토크나이저 구성을 공유합니다. 이 모델은 Qwen3-8B와 동일한 방식으로 실행할 수 있지만 모든 구성 파일이 원래 Qwen3 프로젝트가 아닌 DeepSeek의 저장소에서 제공되는지 확인해야 합니다.

개발자가 Novita AI를 선택하는 이유

간소화된 AI 모델 배포

  • 인프라 관리 불필요: 서버 관리가 아닌 애플리케이션 구축에 집중하세요.
  • 즉시 모델 액세스: 단일 API 호출로 최첨단 모델을 배포하세요.
  • 안정적인 성능: 99.9% 가동 시간을 보장하는 엔터프라이즈급 인프라.
  • 전 세계 어디서나 사용 가능: 전 세계 어디서나 지연 시간이 짧은 액세스.

모든 규모에 완벽

  • 빠른 프로토타이핑: 즉시 모델 액세스로 아이디어를 신속하게 테스트하세요.
  • 프로덕션 준비: 프로토타입에서 프로덕션까지 원활하게 확장하세요.
  • 비용 효율성: 투명한 가격 책정으로 사용한 만큼만 지불하세요.
  • 엔터프라이즈 지원: 대용량 애플리케이션을 위한 전담 지원.

이상적인 사용 사례

  • 수학 AI 애플리케이션: AIME 2025에서 87.5% 정확도를 달성하는 튜터링 플랫폼 구축.
  • 코드 생성 도구: LiveCodeBench에서 73.3% 성공률을 자랑하는 개발 어시스턴트 제작.
  • 연구 플랫폼: 업계 선도 모델과 경쟁하는 추론 모델 배포.
  • 교육 소프트웨어: 단계별 문제 해결 애플리케이션 개발.

Novita AI 시작하기

  1. 가입 하면 몇 초 만에 $10 무료 크레딧 을 받으세요.
  2. DeepSeek-R1-0528 (전체 기능) 또는 DeepSeek-R1-0528-Qwen3-8B (효율적) 탐색.
  3. 대시보드에서 API 키 받기.
  4. OpenAI 호환 엔드포인트를 사용하여 첫 번째 API 호출 실행.
  5. 업계 최고의 추론 기능으로 빌드 시작.

Python 사용자용:

from openai import OpenAI

base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"

client = OpenAI(
    base_url=base_url,
    api_key=api_key,
)

stream = True # 또는 False
max_tokens = 1000

response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        
        {
            "role": "user",
            "content": "안녕하세요!",
        }
    ],
    stream=stream,
    extra_body={
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

결론

DeepSeek-R1-0528 시리즈 모델은 경쟁력 있는 가격으로 업계 최고의 성능을 제공합니다 — AIME 2024에서 91.4%, LiveCodeBench에서 73.3%를 달성하며 OpenAI-o3 및 Gemini-2.5-Pro의 기능과 견줍니다.

Novita AI의 개발자 친화적인 플랫폼을 통해 인프라 복잡성 없이 이러한 최첨단 모델에 즉시 액세스할 수 있습니다. 투명한 가격, $10 무료 크레딧, 직관적인 API를 통해 세계적 수준의 추론을 애플리케이션에 통합하는 것이 그 어느 때보다 쉬워졌습니다.

Novita AI는 개발자에게 간단한 API를 통해 AI 모델을 쉽게 배포할 수 있는 방법을 제공하는 AI 클라우드 플랫폼이며, 또한 저렴하고 안정적인 GPU 클라우드를 제공하여 구축 및 확장을 지원합니다.