친구를 Novita AI에 추천하면 두 분 모두 LLM API 크레딧으로 $10를 받을 수 있습니다. 총 보상은 최대 $500입니다.
개발자 커뮤니티를 지원하기 위해 Qwen2.5-7B, Qwen 3 0.6B, Qwen 3 1.7B, Qwen 3 4B가 현재 Novita AI에서 무료로 제공됩니다.
Qwen3 는 추론, 다국어 지원, 경량 효율성 ** 분야에서 최첨단 기능을 원하는 개발자를 위해 설계된 AI 모델 제품군입니다. Novita AI 플랫폼에서 ** 무료로 액세스하고 원활한 API 통합을 통해 Qwen3는 코딩 지원부터 복잡한 문제 해결까지 동적 애플리케이션을 가능하게 합니다.

Qwen 3의 주요 기능
하이브리드 사고 모드
Qwen3 모델 은 두 가지 모드를 제공하는 하이브리드 문제 해결 방식을 도입했습니다.
- 사고 모드: 복잡한 문제의 경우 모델이 단계별로 추론하여 신중한 답변을 제공합니다.
- 비사고 모드: 간단한 작업의 경우 모델이 빠르고 거의 즉각적인 응답을 제공합니다.
이러한 유연성을 통해 사용자는 작업 요구 사항에 따라 모델의 추론 노력을 제어할 수 있습니다. 어려운 문제는 확장된 추론의 이점을 얻고, 간단한 문제는 빠르게 해결됩니다.
이러한 모드를 결합함으로써 Qwen3 는 **안정적이고 효율적인 사고 예산 제어 ** 를 달성하여 할당된 계산 추론 예산에 따른 확장 가능한 성능 향상을 제공합니다. 이 설계는 작업별 예산 책정을 더 쉽게 만들어 **비용 효율성 ** 과 추론 품질 의 균형을 맞춥니다.
다국어 지원
**Qwen3 모델 ** 은 119개 언어와 방언 을 지원하여 글로벌 애플리케이션에 새로운 가능성을 열어줍니다. 코딩, 에이전트 기능, MCP에 최적화된 Qwen3는 전 세계 사용자가 그 힘을 효과적으로 활용할 수 있도록 합니다.
향상된 에이전트 기능
Qwen3는 코딩 및 에이전트 기능에 최적화되어 있으며 MCP 지원이 강화되었습니다. 아래 예제는 Qwen3가 환경과 상호 작용하고 사고하는 방식을 보여줍니다.
Qwen 3 소형 모델

타이 임베딩 ** 은 자연어 처리(NLP) 모델에서 여러 임베딩 레이어 간에 가중치를 공유하는 데 일반적으로 사용되는 기술입니다. 특히 트랜스포머와 같은 언어 모델에서 신경망의 ** 입력 임베딩 레이어와 출력 임베딩 레이어의 가중치를 묶는(공유하는) 것을 말합니다.
Qwen 3 소형 모델의 학습 방법

다이어그램에서 Qwen 3 0.6B, 1.7B, 4B 가 강력-약 증류 ** 과정을 통해 학습되었음을 추론할 수 있습니다. 이는 ** 경량 모델을 생성하는 파이프라인의 일부입니다. 학습 과정을 단계별로 설명하면 다음과 같습니다.
- 기본 모델:
프로세스는 사전 학습된 기본 모델 로 시작되며, 이는 후속 학습 및 증류의 기반이 됩니다. - 최첨단 모델:
- 기본 모델은 먼저 다단계 프로세스를 통해 학습되어 Qwen3-235B-A22B 및 Qwen3-32B 와 같은 최첨단 모델 을 만듭니다.
- 이 학습에는 다음 단계가 포함됩니다.
- 1단계 (Long-CoT 콜드 스타트): 긴 사고 사슬(CoT) 추론을 통한 초기 학습.
- 2단계 (추론 RL): 추론 능력 향상을 위한 강화 학습.
- 3단계 (사고 모드 융합): 사고 모드(예: 추론 및 빠른 응답 모드) 통합.
- 4단계 (일반 RL): 더 넓은 기능을 위한 일반 강화 학습.
- 강력-약 증류:
- 그런 다음 대규모 **최첨단 모델 **(예: Qwen3-235B 및 Qwen3-32B)을 ** 교사 모델 로 사용하여 Qwen3-4B와 같은 ** 경량 모델의 학습을 안내합니다.
- 이 증류 과정은 더 작은 모델이 더 큰 모델의 지식과 성능을 유지하면서 크기와 계산 요구 사항을 크게 줄이도록 보장합니다.
- Qwen3-4B:
- 이 증류 과정의 결과로 Qwen 3 0.6B, 1.7B, 4B는 더 큰 모델의 지식을 활용하면서 효율성에 최적화된 경량 버전입니다.
Novita API를 통해 Qwen 3 소형 모델에 액세스하는 방법
1단계: 로그인 및 모델 라이브러리 액세스
계정에 로그인하고 모델 라이브러리 버튼을 클릭합니다.

2단계: 모델 선택
사용 가능한 옵션을 검토하고 필요에 맞는 모델을 선택합니다.

3단계: 무료 평가판 시작
선택한 모델의 기능을 살펴보기 위해 무료 평가판을 시작합니다.

4단계: API 키 받기
API 인증을 위해 새 API 키를 제공해 드립니다. “설정” 페이지로 이동하여 이미지에 표시된 대로 API 키를 복사합니다.

5단계: API 설치
프로그래밍 언어에 맞는 패키지 관리자를 사용하여 API를 설치합니다.

설치 후 개발 환경에 필요한 라이브러리를 가져옵니다. API 키로 API를 초기화하여 Novita AI LLM과 상호 작용을 시작합니다. 다음은 Python 사용자를 위한 채팅 완성 API 사용 예시입니다.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "qwen3-0.6b-fp8"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Qwen3는 하이브리드 사고 모드, 다국어 기능, 경량 효율성으로 비교할 수 없는 다재다능함을 제공합니다. 복잡한 문제를 해결하거나 글로벌 애플리케이션을 구축할 때 Qwen3는 더 많은 것을 성취할 수 있도록 지원합니다. 지금 Novita AI의 무료 액세스로 여정을 시작하고 AI 기반 개발의 미래를 탐험하세요.
자주 묻는 질문
Qwen3의 고유한 기능은 무엇인가요?
하이브리드 사고 모드, 다국어 지원, 경량 효율성(0.6B, 1.7B, 4B 모델) 및 향상된 코딩 기능입니다.
Qwen3 모델에 어떻게 액세스하나요?
Novita AI에 로그인하고 모델을 선택한 후 API 키를 받아 제공된 문서에 따라 프로젝트에 통합하세요.
Qwen3 모델은 무료로 사용할 수 있나요?
네! Novita AI는 쉬운 API 통합과 함께 Qwen3 모델에 대한 무료 액세스를 제공합니다.
Novita AI 는 개발자가 간단한 API를 사용하여 AI 모델을 쉽게 배포할 수 있는 AI 클라우드 플랫폼으로, 구축 및 확장을 위한 저렴하고 안정적인 GPU 클라우드도 제공합니다.

