Novita AI, 최상위 THUDM 모델 출시: GLM-4 시리즈

Novita AI, 최상위 THUDM 모델 출시: GLM-4 시리즈

Novita AI가 수학, 코딩에서 뛰어난 성능을 자랑하는 5가지 최상위 THUDM 모델을 소개합니다: GLM-4-32B-0414, GLM-Z1-32B-0414, GLM-Z1-Rumination-32B-0414, GLM-4-9B-0414, GLM-Z1-9B-0414. 개발자와 오픈소스 커뮤니티를 지원하기 위해 GLM-4-9B-0414GLM-Z1-9B-0414 는 무료 API 액세스로 제공됩니다!

Novita AI가 5가지 최상위 THUDM 모델을 자랑스럽게 출시합니다: GLM-4-32B-0414, GLM-Z1-32B-0414, GLM-Z1-Rumination-32B-0414, GLM-4-9B-0414, GLM-Z1-9B-0414.
GLM-4-32B-0414 는 15T의 고품질 데이터와 인간 선호도 정렬을 기반으로 구축되어 강력한 일반 능력을 선도하며, 명령 수행, 도구 사용, 검색 QA에서 탁월합니다.
고성능 또는 비용 효율적인 솔루션을 찾는 개발자를 위해 Novita AI는 GLM-4-9B-0414GLM-Z1-9B-0414 에 대한 무료 API 액세스를 제공합니다.

GLM-4 시리즈 모델이란?

glm model

THUDM의 GLM 시리즈는 특히 수학, 코딩, 추론 작업에서 강력한 기술적 성능을 보여줍니다.

  • 32B 모델 (GLM-4-32B, GLM-Z1-32B, GLM-Z1-Rumination)은 **일반 능력 ** 과 **심층 추론 ** 의 균형을 제공하며, GLM-Z1-Rumination개방형 문제 해결 및 검색 증강 추론 에 특화되어 있습니다.
  • 9B 모델 (GLM-4-9B, GLM-Z1-9B)은 수학 추론 ** 및 ** 일반 작업 성능에 최적화되어 있어 가벼운 배포에 이상적인 인상적인 성능 대비 크기 비율을 달성했습니다.

GLM-4-32B-Base-0414는 전체 시리즈의 기술적 기반 역할을 합니다.

  • 추론 중심의 합성 데이터를 상당량 포함한 15T의 고품질 데이터로 사전 학습되어 복잡한 작업 처리를 위한 강력한 기반을 마련했습니다.
  • 학습 후 최적화는 인간 선호도 정렬 을 통해 자연스럽고 사용자와 일치된 대화 경험을 제공하는 모델의 능력을 향상시켰습니다.

명확한 모델 계층 구조는 다양한 개발 요구를 지원합니다.

  • **복잡한 추론, 심층 글쓰기, 교차 도메인 분석 ** 의 경우 GLM-Z1-Rumination-32B 를 권장합니다.
  • **강력한 범용 성능 ** 이 필요하다면 GLM-4-32B 가 이상적인 선택입니다.
  • **예산이 제한된 프로젝트 ** 나 **대규모 배치 작업 **(예: 번역, QA)의 경우 무료 GLM-4-9BGLM-Z1-9B 모델이 탁월한 비용 대비 성능 균형을 제공합니다.

GLM-4-32B-0414 벤치마크

glm benchmark

GLM-4-32B-0414가 가장 잘하는 것

명령 수행 (IFEval):
GLM-4-32B-0414 는 명령 이해와 실행에서 탁월하며, 모든 모델 중 가장 높은 점수를 기록했습니다.

도구 사용 능력 (BFCL-v3 / TAU-Bench):
GLM-4-32B-0414 는 여러 산업(소매, 항공)에 걸친 도구 사용 작업에서 뛰어난 성능을 보여주며, 단일 턴 및 다중 턴 시나리오 모두에서 선두 또는 공동 1위를 기록했습니다.
특히 복잡한 다중 턴 도구 사용에서 그 장점이 두드러지며, 2위 모델보다 약 10포인트 높은 성능을 보였습니다.

검색 기반 질문 응답 (SimpleQA, HotpotQA):
GLM-4-32B-0414 는 검색 QA에서 강력한 능력을 보여주며 SimpleQA 에서 가장 높은 점수(88.1)를 기록했고, HotpotQA 에서는 GPT-4o-1120 에 거의 근접하면서 DeepSeek-V3-0324Qwen2.5-Max 보다 훨씬 뛰어난 성능을 보였습니다.

GLM-4 시리즈 성능

코드 vs Gemini 2.5 Flash

GLM-4 시리즈 모델에 액세스하는 방법

1단계: 로그인하고 모델 라이브러리 액세스

계정에 로그인하고 Model Library 버튼을 클릭합니다.

Log In and Access the Model Library

지금 GLM-4 데모 사용해보기!

2단계: 모델 선택

사용 가능한 옵션을 살펴보고 필요에 맞는 모델을 선택합니다.

glm model on novita ai

3단계: 무료 체험 시작

선택한 모델의 기능을 살펴보기 위해 무료 체험을 시작합니다.

start your free trail

4단계: API 키 받기

API 인증을 위해 새로운 API 키를 제공합니다. “Settings“ 페이지로 이동하여 이미지에 표시된 대로 API 키를 복사합니다.

get api key

5단계: API 설치

프로그래밍 언어에 맞는 패키지 관리자를 사용하여 API를 설치합니다.

install the api

설치 후 필요한 라이브러리를 개발 환경에 가져옵니다. API 키로 API를 초기화하여 Novita AI LLM과 상호작용을 시작합니다. 다음은 Python 사용자를 위한 채팅 완성 API 사용 예제입니다.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "thudm/glm-4-32b-0414"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  
  

결론

GLM-4-32B-0414 는 명령 준수부터 복잡한 다중 턴 도구 사용에 이르기까지 주요 AI 작업에서 뛰어난 강점을 보여줍니다. 균형 잡힌 기능과 미세 조정된 대화 최적화를 결합하여 강력하고 다양한 모델이 필요한 개발자에게 이상적인 선택입니다.
Novita AI의 지원 덕분에 GLM 모델 탐색이 그 어느 때보다 쉬워졌습니다. 모델 플레이그라운드 에서 GLM-4의 능력을 확인해보세요.

자주 묻는 질문

GLM-4-32B-0414를 다른 모델과 구별하는 점은 무엇인가요?

GLM-4-32B-0414 는 광범위한 사전 학습과 미세 조정된 대화 최적화를 기반으로 명령 수행, 다중 턴 도구 사용, 검색 기반 QA에서 탁월합니다.

Novita AI를 통해 GLM-4-32B-0414를 사용해볼 수 있나요?

네, GLM-4-32B-0414 는 Novita AI에서 경쟁력 있는 API 가격으로 제공되며, GLM-4-9BGLM-Z1-9B 는 무료로 액세스할 수 있습니다.

GLM-4 시리즈 모델은 어떤 작업에 가장 적합한가요?

GLM-4-32B-0414 는 심층 추론, 복잡한 대화, 높은 정확도의 명령 실행이 필요한 작업에 이상적입니다.

Novita AI 는 개발자가 간단한 API를 사용하여 AI 모델을 쉽게 배포할 수 있도록 하고, 구축 및 확장을 위한 저렴하고 안정적인 GPU 클라우드를 제공하는 AI 클라우드 플랫폼입니다.

추천 읽을거리