알리바바의 획기적인 Qwen3-Coder-480B-A35B-Instruct가 이제 Novita AI에서 제공됩니다.
가장 진보된 에이전틱 코드 모델 중 하나인 Qwen3-Coder-480B-A35B-Instruct는 에이전틱 코딩, 브라우저 자동화, 도구 사용에서 Claude Sonnet과 견줄 만한 성능을 제공합니다.
480B 파라미터와 35B 활성화 파라미터를 갖춘 이 Mixture-of-Experts 모델은 AI 기반 소프트웨어 개발 및 자율 코딩 워크플로우에서 가능한 수준을 크게 향상시킵니다.
현재 Novita AI 가격: 입력 토큰 100만 개당 $0.95, 출력 토큰 100만 개당 $5
Qwen3-Coder-480B-A35B-Instruct 데모 사용해보기
Qwen3-Coder-480B-A35B-Instruct란?

Qwen3-Coder-480B-A35B-Instruct는 알리바바 코딩 AI 개발의 정점으로, 고급 에이전틱 코딩 기능을 갖추고 있습니다. 480B 파라미터에 35B 활성화 파라미터를 가진 이 Mixture-of-Experts 모델은 자율 소프트웨어 개발, 다중 턴 프로그래밍 워크플로우, 저장소 규모 이해를 위해 특별히 설계되었습니다.
기술 사양
- 유형: Causal Language Models
- 전체 파라미터: 480B (35B 활성화)
- 아키텍처: 62개 레이어, 96개 어텐션 헤드 (Q) 및 8개 (KV)
- 전문가(Expert): 총 160개 중 8개 활성화
- 컨텍스트 길이: 기본 262,144 토큰, YaRN으로 최대 1M까지 확장 가능
- 훈련 데이터: 7.5T 토큰 (코드 비율 70%)
- 모드: 비추론 모드만 지원
- 호환성: transformers ≥4.51.0 필요
주요 기능 및 성능
핵심 역량
고급 에이전틱 코딩: 자율 코드 생성, 디버깅, 소프트웨어 엔지니어링 워크플로우에서 상용 프리미엄 모델과 경쟁하는 수준의 향상된 성능.
긴 컨텍스트 이해: 기본 256K 토큰 지원, 1M 토큰 확장을 통해 포괄적인 저장소 분석 및 파일 간 추론 가능.
도구 통합: Qwen Code, CLINE, Claude Code, Trae 등 인기 플랫폼을 지원하는 전문화된 함수 호출 형식.
다중 턴 개발: 계획 수립, 도구 사용, 피드백 처리, 반복 개발 사이클이 필요한 복잡한 작업에서 뛰어난 성능.
성능 하이라이트
Qwen3-Coder-480B-A35B-Instruct는 여러 벤치마크에서 오픈소스 모델 중 강력한 성능을 달성합니다:

- 에이전틱 코딩: 고급 자율 프로그래밍 능력
- 브라우저 자동화: 웹 자동화 워크플로우에서 인상적인 결과
- SWE-Bench: 실제 소프트웨어 엔지니어링 작업에서 주목할 만한 성능
- 다중 언어 지원: 다양한 프로그래밍 언어 및 프레임워크에서 견고한 성능
Novita AI에서 Qwen3-Coder-480B-A35B-Instruct 사용 방법
플레이그라운드 인터페이스 (코딩 불필요)
- 빠른 설정: 회원가입 후 Qwen3-Coder-480B-A35B-Instruct를 다른 최고 모델과 함께 바로 실험해보세요.
- 대화형 테스트: 복잡한 코딩 프롬프트를 테스트하고 에이전틱 기능을 실시간으로 평가하세요.
- 모델 비교: Qwen3-Coder-480B-A35B-Instruct와 다른 주요 코딩 모델을 쉽게 비교할 수 있습니다.
API 통합 (개발자용)
Novita AI의 통합 REST API를 사용하여 애플리케이션에 연결하세요:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "qwen/qwen3-coder-480b-a35b-instruct"
stream = True # or False
max_tokens = 131072
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Qwen3-Coder로 코딩하기
Qwen Code - 전용 CLI 도구
Qwen Code는 Gemini CLI에서 파생된 연구용 CLI 도구로, Qwen-Coder 모델을 위한 향상된 파서 및 도구 지원을 제공합니다.
사전 요구 사항: Node.js 버전 20 이상이 설치되어 있어야 합니다. 공식 Node.js 웹사이트에서 다운로드할 수 있습니다.
패키지를 전역으로 설치하세요:
bash
npm install -g @qwen-code/qwen-code
3단계: 환경 변수 구성
Windows (명령 프롬프트):
set OPENAI_API_KEY=Your_Novita_API_Key
set OPENAI_BASE_URL=https://api.novita.ai/v3/openai
set OPENAI_MODEL=qwen/qwen3-coder-480b-a35b-instruct
Linux 및 Mac (Bash):
export OPENAI_API_KEY=“Your_Novita_API_Key”
export OPENAI_BASE_URL=“https://api.novita.ai/v3/openai”
export OPENAI_MODEL=“qwen/qwen3-coder-480b-a35b-instruct”
설치 및 구성이 완료되면 프로젝트 디렉토리에서 Qwen Code를 시작할 수 있습니다. cd 명령어로 원하는 프로젝트 위치로 이동하세요:
cd <your-project-directory>
qwen .
Cline - VSCode 통합
설정 단계 (자세한 설정 가이드 참조):**
- VSCode에 Cline 확장 설치 (
Ctrl + Shift + X, “Cline” 검색) - 사이드바에서 Cline 아이콘 클릭
- “OpenAI Compatible” 제공자 선택
- 구성:
- Base URL:
https://api.novita.ai/v3/openai - API Key: Novita AI API 키
- Model:
qwen/qwen3-coder-480b-a35b-instruct-fp8
- Base URL:
이중 모드 워크플로우:
- Plan Mode: 전체 저장소 이해를 바탕으로 한 전략적 분석 및 계획 수립
- Act Mode: 직접적인 코드 변경 및 파일 관리를 통한 구현 실행
Trae - 기본 통합
Trae는 Novita AI 통합을 기본으로 제공합니다. Trae의 모델 인터페이스에서 Qwen3-Coder-480B-A35B-Instruct를 선택하기만 하면 에이전틱 코딩 기능을 즉시 사용할 수 있습니다.
Trae에 대한 자세한 설정 가이드 를 확인하세요.
모범 사례
권장 파라미터
- Temperature: 0.7
- Top P: 0.8
- Top K: 20
- Repetition Penalty: 1.05
출력 구성
- 표준 작업: 포괄적인 코드 생성을 위해 65,536 토큰
- 저장소 규모: 대규모 코드베이스 분석을 위해 전체 256K 컨텍스트 활용
결론
Qwen3-Coder-480B-A35B-Instruct는 자율 코딩 AI의 중요한 발전을 나타내며, 오픈소스 접근성을 유지하면서 Claude Sonnet에 필적하는 성능을 제공합니다. 고급 에이전틱 기능, 광범위한 도구 통합, 저장소 규모 이해를 통해 이 모델은 개발자가 복잡한 소프트웨어 엔지니어링 작업에 접근하는 방식을 크게 향상시킵니다.
이 모델은 Qwen Code, Claude Code, Cline, Trae 등 인기 개발 도구와 원활하게 통합되어 현대 개발 워크플로우에 가치 있는 추가 요소가 되며, 개발자가 AI 지원을 통해 복잡한 문제를 해결할 수 있도록 돕습니다.
코딩 워크플로우를 향상시킬 준비가 되셨나요? 지금 바로 Novita AI 플랫폼에서 Qwen3-Coder-480B-A35B-Instruct를 사용해보세요.
Novita AI는 개발자에게 간단한 API로 AI 모델을 손쉽게 배포할 수 있는 방법을 제공하고, AI 모델 구축 및 확장을 위한 경제적이고 안정적인 GPU 클라우드를 제공하는 AI 클라우드 플랫폼입니다.
