MiniMax M1 사용 방법

MiniMax M1 사용 방법

MiniMax M1은 AI 언어 모델 기술의 중요한 도약으로, 강력한 장기 컨텍스트 추론 기능과 유연한 배포 옵션을 제공합니다. 이 포괄적인 가이드는 MiniMax M1에 액세스하고 구현하는 방법을 안내하여 AI 기반 프로젝트를 향상시키는 데 필요한 도구를 제공합니다.

주요 특징

MiniMax M1: 456B 파라미터 MoE 모델, 1M 컨텍스트.

API를 통한 MiniMax M1 사용
간편한 OpenAI 호환 API.
사용자 정의 가능한 파라미터, 무료 체험 가능.

로컬에서 MiniMax M1 사용
단계별 설치 가이드.

타사 플랫폼에서 MiniMax M1 연결
Hugging Face Spaces, 에이전트 프레임워크 및 OpenAI 호환 API를 통해 MiniMax M1을 원활하게 통합하여 개발 워크플로우를 간소화합니다.

한정된 기간 동안 신규 사용자는 Novita AI에서 LLM API를 탐색하고 구축할 수 있는 $10 무료 크레딧 을 받을 수 있습니다.

MiniMax M1이란?

MiniMax M1은 세계 최초의 오픈소스 대규모 하이브리드 전문가 추론 모델입니다. **MoE(Mixture-of-Experts) 아키텍처 ** 와 혁신적인 Lightning Attention 메커니즘을 결합하여 초장기 컨텍스트 추론 및 복잡한 작업을 위해 설계되었습니다. MiniMax는 **함수 호출 ** 을 지원하며, 최대 100만 토큰의 컨텍스트 를 처리할 수 있어 연구, 소프트웨어 개발, 수학적 추론 및 기타 까다로운 애플리케이션에 이상적입니다.

기본 정보 세부 사항
출시일 2025년 6월
모델 크기 456B 파라미터(45.9B 활성)
아키텍처 하이브리드 MoE(Mixture-of-Experts) + Lightning Attention
컨텍스트 길이 1M 토큰
학습 다양한 문제 세트에 대한 대규모 강화 학습
특별 기능 테스트 시간 계산의 효율적인 확장, RL을 위한 하이브리드 어텐션

MiniMax M1 벤치마크

MiniMax M1 벤치마크

MiniMax M1

효율적인 장기 컨텍스트 처리:

  • 긴 컨텍스트 윈도우를 지원하여 한 번에 매우 긴 문서, 기술 코드베이스 및 다중 턴 대화를 처리할 수 있습니다.
  • Lightning Attention을 사용한 하이브리드 MoE(Mixture-of-Experts) 아키텍처를 채택하여 효율적인 추론을 가능하게 하며, 유사한 밀집 모델에 비해 계산 비용을 약 25%로 줄입니다.
  • 대규모 지식 베이스, 연구 논문 및 심층 컨텍스트 이해가 필요한 에이전트 워크플로우를 처리하는 기업에 이상적입니다.

비용 효율적인 배포:

  • 입력 토큰 100만 개당 $0.55, 출력 토큰 100만 개당 $2.2의 경쟁력 있는 API 가격을 제공합니다.

오픈소스 및 연구 친화적:

  • 완전 오픈 가중치 모델로 커뮤니티의 파인튜닝 및 통합을 장려하며, 법률, 의료, 과학 연구 분야의 도메인별 사용자 정의를 지원합니다.
  • 함수 호출 및 에이전트 AI 도구 사용을 지원하여 복잡한 워크플로우와 다단계 추론을 가능하게 합니다.

API를 통한 MiniMax M1 사용

Novita AI 는 개발자가 간단한 API를 통해 AI 모델을 쉽게 배포할 수 있도록 지원하는 AI 클라우드 플랫폼이며, 동시에 구축 및 확장을 위한 저렴하고 안정적인 GPU 클라우드를 제공합니다.

1단계: 로그인 및 모델 라이브러리 액세스

계정에 로그인하고 모델 라이브러리 버튼을 클릭합니다.

로그인 및 모델 라이브러리 액세스

지금 MiniMax M1 데모 사용해보기!

2단계: 모델 선택

사용 가능한 옵션을 탐색하고 필요에 맞는 모델을 선택합니다.

모델 선택

3단계: 무료 체험 시작

무료 체험을 시작하여 선택한 모델의 기능을 살펴보세요.

MiniMax M1 플레이그라운드

4단계: API 키 받기

API 인증을 위해 새로운 API 키를 제공합니다. “Settings” 페이지로 이동하여 이미지에 표시된 대로 API 키를 복사합니다.

API 키 받기

5단계: API 설치

프로그래밍 언어에 맞는 패키지 관리자를 사용하여 API를 설치합니다.

API 설치

설치 후 개발 환경에 필요한 라이브러리를 가져옵니다. API 키로 API를 초기화하여 Novita AI LLM과 상호 작용을 시작합니다. 다음은 Python 사용자를 위한 채팅 완성 API 사용 예시입니다.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "minimaxai/minimax-m1-80k"
stream = True # or False
max_tokens = 20000
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

로컬에서 MiniMax M1 실행하기

단계별 설치 가이드

# 1단계: Python 설치 및 가상 환경 생성
# Python 3.8+가 설치되어 있는지 확인한 후 가상 환경을 생성하고 활성화합니다.
python3 -m venv minimax_env
source minimax_env/bin/activate  # Windows의 경우 `minimax_env\Scripts\activate` 사용

# 2단계: 필요 라이브러리 설치
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118  # GPU 최적화 PyTorch
pip install vllm huggingface-hub  # MiniMax M1 서빙을 위한 vLLM 및 Hugging Face 유틸리티

# 3단계: (선택 사항) 나중에 모델을 pull하려면 Hugging Face에 로그인
pip install huggingface-cli
huggingface-cli login  # 프롬프트에 따라 인증

# 4단계: MiniMax M1 모델 다운로드 (아직 다운로드하지 않은 경우)
# <model-name>을 Hugging Face의 실제 MiniMax M1 저장소 이름으로 바꾸세요.
huggingface-cli download MiniMaxAI/MiniMax-M1-80k --local-dir ./minimax-m1

# 5단계: 빠른 로딩을 위한 환경 변수 설정 (Linux/macOS)
export SAFETENSORS_FAST_GPU=1

# 6단계: vLLM을 사용하여 MiniMax M1 API 서버 실행
# --tensor-parallel-size를 GPU 수에 맞게 조정하세요.
python3 -m vllm.entrypoints.api_server \
  --model ./minimax-m1 \
  --tensor-parallel-size 8 \
  --trust-remote-code \
  --max_model_len 8192 \
  --dtype bfloat16

# 7단계: curl로 추론 테스트 (새 터미널에서)
curl -X POST http://localhost:8000/generate \
  -H "Content-Type: application/json" \
  -d '{"prompt": "Explain quantum computing in simple terms.", "max_tokens": 100}'

# 8단계: (선택 사항) Python 추론 예제
python3 -c "
import requests
response = requests.post('http://localhost:8000/generate', json={
    'prompt': 'Explain quantum computing in simple terms.',
    'max_tokens': 100
})
print(response.json())
"

GPU 메모리 요구 사항:

  • 최소: 640GB VRAM
  • 권장: 1,128GB VRAM (8 x H200 SXM 141GB 구성) – 최적 성능

타사 플랫폼에서 MiniMax M1 연결

  • Hugging Face: Novita AI 엔드포인트를 통해 MiniMax M1 을 Spaces, 파이프라인 또는 Transformers 라이브러리에서 사용하세요.

Hugging Face의 MiniMax M1

  • 에이전트 및 오케스트레이션 프레임워크: Continue, AnythingLLM, LangChain, Dify, Langflow와 같은 파트너 플랫폼에 공식 커넥터와 단계별 통합 가이드를 통해 Novita AI를 쉽게 연결하세요.
  • OpenAI 호환 API: ClineCursor와 같은 도구와의 손쉬운 마이그레이션 및 통합을 제공하며, OpenAI API 표준에 맞게 설계되었습니다.

Novita AI는 20개 이상의 플랫폼과 통합되어 있으며, 자세한 튜토리얼은 문서에서 확인할 수 있습니다.

Novita AI 20개 이상 플랫폼 통합

MiniMax M1은 초장기 컨텍스트 길이와 복잡한 추론 작업에서 탁월한 성능을 발휘하는 획기적인 대규모 하이브리드 어텐션 추론 모델입니다. Lightning Attention 메커니즘과 결합된 하이브리드 MoE(Mixture-of-Experts) 아키텍처를 특징으로 하여 효율적이고 확장 가능한 추론을 가능하게 합니다. MiniMax M1을 API를 통해 사용하거나 타사 플랫폼에서 연결할 수 있습니다.

한정된 기간 동안 신규 사용자는 Novita AI에서 LLM API를 탐색하고 구축할 수 있는 $10 무료 크레딧 을 받을 수 있습니다.

자주 묻는 질문

MiniMax AI를 무료로 사용하려면 어떻게 해야 하나요?

Novita AI에서 MiniMax AI 데모를 무료로 체험할 수 있습니다. 신규 사용자는 Novita AI에서 LLM API를 탐색하고 구축할 수 있는 $10 무료 크레딧 을 받을 수 있습니다.

로컬에서 MiniMax M1을 실행하려면 어떤 하드웨어가 필요한가요?

최소: 640GB VRAM
권장: 1,128GB VRAM (8 x H200 SXM 141GB 구성) – 최적 성능

MiniMax M1은 오픈소스인가요?

네, MiniMax M1은 완전 오픈소스이며 Hugging Face와 같은 플랫폼에서 사용할 수 있습니다.

Novita AI 소개

Novita AI 는 개발자가 간단한 API를 통해 AI 모델을 쉽게 배포할 수 있도록 지원하는 AI 클라우드 플랫폼이며, 동시에 구축 및 확장을 위한 저렴하고 안정적인 GPU 클라우드를 제공합니다.