Qwen3-235B-A22B-Instruct-2507 지금 Novita AI에서 사용 가능

Qwen3-235B-A22B-Instruct-2507 지금 Novita AI에서 사용 가능

알리바바의 혁신적인 Qwen3-235B-A22B-Instruct-2507이 이제 Novita AI에서 사용 가능합니다.

GPT-4o, Claude Opus 및 다른 업계 선두 모델과 맞먹거나 능가하는 벤치마크 점수를 자랑하는 Qwen3-235B-A22B-Instruct-2507은 비용의 극히 일부만으로 엔터프라이즈급 성능을 제공합니다. 차세대 챗봇, 복잡한 추론 시스템 또는 다국어 애플리케이션을 구축하든, 이 모델은 프로덕션 환경에서 달성 가능한 수준을 재정의합니다.

Novita AI의 현재 가격: $0.15 / M 입력 토큰, $0.8 / M 출력 토큰

Qwen3-235B-A22B-Instruct-2507 데모 사용해보기

Qwen3-235B-A22B-Instruct-2507이란?

Qwen3-235B-A22B-Instruct-2507은 알리바바의 플래그십 235B 파라미터 모델의 향상된 버전으로, 명령어 따르기, 수학적 추론, 코딩 능력, 사용자 정렬 측면에서 상당한 개선을 제공합니다. 이 모델은 기본 Qwen3-235B-A22B 아키텍처를 기반으로 주요 벤치마크에서 측정 가능한 성능 향상을 제공하는 표적 최적화를 적용했습니다.

혁신적인 향상

혁신적인 성능 향상: 가장 진보된 상용 모델조차 능가하는 명령어 따르기, 논리적 추론, 텍스트 이해, 수학, 과학, 코딩 및 도구 사용에서 극적인 도약을 경험하세요.

전례 없는 지식 숙달: 여러 언어에 걸친 롱테일 지식 범위에서의 엄청난 향상으로, 오픈소스 모델로는 이전에 불가능했던 애플리케이션을 가능하게 합니다.

완벽한 사용자 정렬: 주관적이고 개방형 작업에서 사용자 선호도와의 탁월한 정렬로, 자연스럽고 맥락에 완벽한 응답을 제공합니다.

확장된 컨텍스트 마스터리: 전체 문서, 연구 논문 및 긴 대화에서 완벽한 일관성을 유지하는 혁신적인 256K 장문맥 이해.

기술적 우수성

  • 유형: 인과 언어 모델
  • 훈련 단계: 사전 훈련 및 사후 훈련
  • 총 파라미터: 235B (22B 활성화)
  • 비임베딩 파라미터: 234B
  • 아키텍처: 94개 레이어
  • 어텐션 헤드(GQA): Q 64개, KV 4개
  • 전문가: 총 128개 (8개 활성화)
  • 컨텍스트 길이: 기본 262,144 토큰
  • 모드: 비사고 모드 전용 ( thinking response 블록을 생성하지 않음)

성능 벤치마크

Qwen3-235B-A22B-Instruct-2507은 업계 선두 모델과 단순히 경쟁하는 것이 아니라, 그들을 압도합니다. 포괄적인 평가 벤치마크 전반에서 이 모델은 GPT-4o, Claude Opus 4, Deepseek-V3 및 기타 프리미엄 모델을 일관되게 능가하며, 종종 상당한 차이로 앞섭니다.

Qwen/Qwen3-235B-A22B-Instruct-2507 벤치마크

종합 성능 결과

Qwen3-235B-A22B-Instruct-2507 벤치마크

주요 성능 하이라이트

수학적 우수성: AIME25에서 놀라운 70.3%, HMMT25에서 55.4%를 기록한 Qwen3-235B-A22B-Instruct-2507은 모든 경쟁자를 크게 능가하는 탁월한 수학적 추론 능력을 입증합니다.

논리적 추론 마스터리: ZebraLogic에서 95.0%의 뛰어난 성과는 거의 완벽에 가까운 논리적 추론 능력을 보여주며, ARC-AGI에서 41.8%는 강력한 추상적 추론 능력을 입증합니다.

뛰어난 지식 이해: GPQA에서 77.5%, SimpleQA에서 54.3%를 포함한 지식 벤치마크 전반에서 선도적인 성능을 보여주며, 사실적 정확성에 대한 새로운 기준을 세웁니다.

코딩 리더십: LiveCodeBench v6에서 최고 성능(51.8%)과 MultiPL-E에서 강력한 결과(87.9%)는 여러 언어에 걸친 탁월한 프로그래밍 능력을 확인시켜 줍니다.

사용자 선호도 정렬: Arena-Hard v2에서 79.2%의 뛰어난 점수는 인간의 선호도와 기대에 대한 탁월한 정렬을 보여줍니다.

다국어 우수성: MultiIF에서 77.5%, PolyMATH에서 50.2%를 기록하며 모든 다국어 벤치마크에서 강력한 성능을 보여, 진정한 글로벌 언어 능력을 입증합니다.

Novita AI에서 Qwen3-235B-A22B-Instruct-2507에 액세스하는 방법

Novita AI에서 Qwen3-235B-A22B-Instruct-2507을 시작하는 것은 간단하며, 안정적이고 고성능의 언어 모델 액세스가 필요한 개발자와 연구자 모두를 위해 설계되었습니다.

플레이그라운드 사용하기 (코딩 불필요)

즉시 액세스: 가입하고 몇 초 만에 Qwen3-235B-A22B-Instruct-2507 및 다른 최고 모델로 실험을 시작하세요.

대화형 인터페이스: 직관적인 플레이그라운드에서 복잡한 프롬프트를 테스트하고, 추론 능력을 평가하며, 결과를 실시간으로 시각화하세요.

모델 비교: Qwen3-235B-A22B-Instruct-2507을 다른 선도 모델과 원활하게 비교하여 특정 사용 사례에 맞는 완벽한 솔루션을 찾으세요.

API를 통해 통합하기 (개발자용)

Novita AI의 통합 REST API를 사용하여 Qwen3-235B-A22B-Instruct-2507을 애플리케이션에 연결하세요. 인프라 관리가 필요하지 않습니다. 훌륭한 제품 구축에만 집중하세요.

옵션 1: 직접 API 통합 (Python 예제)

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "qwen/qwen3-235b-a22b-instruct-2507"
stream = True # or False
max_tokens = 131072
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

주요 기능:

  • OpenAI 호환 API: 기존 OpenAI 기반 워크플로우와의 원활한 통합
  • 유연한 파라미터 제어: 포괄적인 파라미터 옵션으로 모델 동작 미세 조정
  • 스트리밍 지원: 실시간 스트리밍 또는 배치 응답 중 선택

옵션 2: OpenAI Agents SDK를 사용한 멀티에이전트 워크플로우

Qwen3-235B-A22B-Instruct-2507을 사용하여 정교한 멀티에이전트 시스템을 구축하세요:

  • 플러그 앤 플레이 통합: 모든 OpenAI Agents 워크플로우에서 Novita AI의 모델 사용
  • 고급 에이전트 기능: 핸드오프, 라우팅 및 도구 통합 지원
  • 확장 가능한 아키텍처: 작업을 위임하고 복잡한 기능을 실행하는 에이전트 설계

타사 플랫폼과 연결

개발 도구: OpenAI 호환 API를 통해 Cursor, Continue, Trae 및 Cline과 같은 인기 IDE 및 개발 환경과 원활하게 통합.

오케스트레이션 프레임워크: 공식 커넥터를 사용하여 LangChain, Dify, Langflow 및 기타 AI 오케스트레이션 플랫폼에 연결.

Hugging Face 통합: Novita AI 엔드포인트를 통해 Spaces, 파이프라인 또는 Transformers 라이브러리에서 Qwen3-235B-A22B-Instruct-2507 사용.

최적 성능을 위한 모범 사례

Qwen 팀의 공식 권장 사항을 기반으로, Qwen3-235B-A22B-Instruct-2507에서 최적의 성능을 달성하기 위해 다음 지침을 따르세요.

권장 샘플링 파라미터

Temperature: 0.7
TopP: 0.8
TopK: 20
MinP: 0

지원되는 프레임워크의 경우 presence_penalty 파라미터를 0에서 2 사이로 조정하여 끝없는 반복을 줄일 수 있습니다. 그러나 높은 값을 사용하면 때때로 언어 혼합이 발생하고 모델 성능이 약간 저하될 수 있습니다.

출력 길이 권장 사항

표준 사용: 대부분의 쿼리에 대해 16,384 토큰의 출력 길이를 사용하세요. 이는 인스트럭트 모델에 적합합니다.

복잡한 작업: 광범위한 추론이나 포괄적인 응답이 필요한 작업의 경우 모델의 컨텍스트 창 제한 내에서 출력 길이를 늘리는 것을 고려하세요.

작업별 프롬프팅 지침

수학 문제: 프롬프트에 다음 지침을 포함하세요: Copy

"Please reason step by step, and put your final answer within \boxed{}."

객관식 질문: 응답을 표준화하기 위해 다음 JSON 구조를 추가하세요: Copy

"Please show your choice in the answer field with only the choice letter, e.g., \"answer\": \"C\"."

결론

Qwen3-235B-A22B-Instruct-2507은 오픈소스 AI가 선도적인 상용 모델과 효과적으로 경쟁할 수 있음을 증명합니다. 추론, 코딩, 수학 및 다국어 작업에서 GPT-4o, Claude Opus 및 다른 업계 선두 모델과 맞먹거나 능가하는 성능을 통해 이 모델은 훨씬 낮은 비용으로 고급 AI 기능에 대한 액세스를 제공합니다.

고성능 AI를 애플리케이션에 통합할 준비가 되셨나요? 지금 Novita AI 플랫폼에서 Qwen3-235B-A22B-Instruct-2507을 사용해 보세요.

Novita AI는 개발자가 간단한 API를 사용하여 AI 모델을 쉽게 배포할 수 있는 AI 클라우드 플랫폼이며, 구축 및 확장을 위한 저렴하고 안정적인 GPU 클라우드를 제공합니다.