Novita AI에서 MiniMax M3 API 빠른 시작

Novita AI에서 MiniMax M3 API 빠른 시작

MiniMax M3는 Novita AI에서 모델 ID minimax/minimax-m3, OpenAI 호환 기본 URL, 1,000,000 토큰 컨텍스트 창, 긴 프롬프트를 위한 계층형 가격을 통해 사용할 수 있습니다. 이 빠른 시작은 실용적인 설정을 유지합니다: 모델 ID 복사, API 키 설정, 하나의 작은 요청 실행, 그 후 기본 사항이 작동하면 더 긴 프롬프트로 확장합니다.

이 빠른 시작을 사용해야 할 때

이 빠른 시작은 원시 모델 호스팅을 중심으로 구축하는 대신 서버리스 API 경로를 통해 MiniMax M3를 테스트하려는 경우에 사용합니다. 이미 염두에 둔 프롬프트나 워크로드가 있고 작은 개념 증명을 작성하기 전에 엔드포인트, 모델 ID, 토큰 제한 및 가격 세부 정보가 필요한 개발자를 위한 것입니다.

MiniMax M3는 요청에 큰 컨텍스트 예산, 구조화된 출력, 도구 지향 작업 또는 긴 입력에 대한 코딩 지원이 필요할 때 적합합니다. Novita AI에서 현재 모델 페이지는 입력 모달리티로 text, image, video를, 출력 모달리티로 text를, 그리고 서버리스 액세스, 함수 호출, 구조화된 출력, 추론, Anthropic API 호환성을 지원한다고 나열합니다.

이것은 벤치마크 심층 분석이나 출시 발표가 아닙니다. 목표는 더 간단합니다: 하나의 깔끔한 요청을 만든 다음 MiniMax M3가 애플리케이션에 적합한지 결정하는 것입니다.

1단계: Novita API 키 가져오기

Novita AI 계정을 만들거나 선택하고, API 키 설정을 열고, 서버 측 사용을 위한 키를 생성합니다. 키를 클라이언트 측 코드, 프런트엔드 번들, 공개 리포지토리 및 팀 외부에서 공유될 수 있는 노트북에서 멀리 유지하세요.

예제를 실행하기 전에 키를 환경 변수로 설정합니다:

export NOVITA_API_KEY="your_api_key_here"

팀 환경에서 테스트하는 경우, 계정 설정에서 지원하는 경우 범위가 지정된 프로젝트 키나 임시 키를 사용하세요. 공개 데모, 공유 실험 또는 우발적 노출 후에 키를 교체하세요.

2단계: 모델 ID 및 엔드포인트 확인

코드를 작성하기 전에 MiniMax M3 연결 세부 정보를 한 곳에 보관하세요:

필드
모델 ID minimax/minimax-m3
기본 URL https://api.novita.ai/openai
채팅 완료 URL https://api.novita.ai/openai/v1/chat/completions
컨텍스트 창 1,000,000 토큰
최대 출력 131,072 토큰
입력 텍스트, 이미지, 비디오
출력 텍스트
서버리스 지원 지원됨
함수 호출 지원됨
구조화된 출력 지원됨
추론 지원됨
Anthropic API 호환성 지원됨

배포하기 전에 MiniMax M3 모델 문서를 확인하세요. 가용성, 가격 및 제한 사항이 변경될 수 있습니다.

3단계: 첫 번째 요청 보내기

짧은 텍스트 전용 채팅 요청으로 시작하세요. 큰 프롬프트를 추가하기 전에 인증, 라우팅 및 응답 구문 분석을 디버그하는 것이 훨씬 쉽습니다.

첫 번째 프롬프트에서는 결정적이고 확인하기 쉬운 출력을 요청하세요. 예: 긴 컨텍스트 코드 리뷰 프로세스의 주요 구현 위험을 요약하세요.

첫 번째 호출에서는 max_tokens을 적당히 유지하세요. MiniMax M3는 훨씬 긴 출력을 지원하지만, 첫 번째 작업은 통합이 작동하는지 확인하는 것입니다.

4단계: 응답 읽기

OpenAI 호환 채팅 완료 응답은 일반적으로 choices[0].message.content에서 도우미 답변을 반환합니다.

또한 런타임이 노출하는 요청 ID 또는 응답 메타데이터를 기록하세요. 이러한 세부 정보는 요청이 실패하거나 느리게 실행될 때 유용합니다. 비용 추적을 위해 프롬프트 크기, 출력 크기, 워크로드가 캐시된 컨텍스트를 사용하는 경우 캐시 읽기 사용량 및 요청이 긴 컨텍스트 가격 대역에 진입했는지 여부를 기록하세요.

첫 번째 출력을 프롬프트가 사용자에게 준비되었다는 증거로 취급하지 마세요. 통합이 작동하면 실제 워크로드와 유사한 프롬프트를 테스트하세요: 긴 코드베이스, 다중 파일 지침, 도구 스키마, 구조화된 JSON 출력 또는 애플리케이션에 필요한 경우 멀티모달 입력.

5단계: 가격, 제한 사항 및 일반적인 오류 확인

MiniMax M3는 Novita AI에서 계층형 가격을 사용합니다. 프롬프트가 긴 컨텍스트 대역에 진입하면 가격이 변경됩니다:

프롬프트 크기 대역 입력 출력 캐시 읽기
524,288 토큰 미만 1M 토큰당 $0.30 1M 토큰당 $1.20 1M 토큰당 $0.06
524,288 ~ 1,000,000 토큰 1M 토큰당 $1.20 1M 토큰당 $4.80 1M 토큰당 $0.24

이 차이는 중요합니다. 50,000 토큰 테스트와 거의 1M 토큰 요청은 같은 방식으로 가격이 책정되지 않습니다. 비용을 추정할 때 프롬프트 길이, 예상 출력 길이, 캐시 동작, 재시도 및 사용자가 매우 큰 요청을 보낼 빈도를 포함하세요.

MiniMax M3는 현재 1,000,000 토큰 컨텍스트 창과 131,072 토큰 최대 출력을 가지고 있습니다. 배송 전에 최신 가격표와 계정에 연결된 속도 제한 지침에 대해 MiniMax M3 모델 문서를 다시 확인하세요.

일반적인 설정 오류는 다음과 같습니다:

  • 누락되거나 잘못된 Authorization 헤더.
  • 표시 이름 대신 minimax/minimax-m3 대신 잘못된 모델 ID 사용.
  • 잘못된 기본 URL로 요청 보내기.
  • 애플리케이션이 안전하게 소비할 수 있는 것보다 max_tokens을 높게 설정.
  • 더 높은 가격 대역을 고려하지 않고 긴 컨텍스트 프롬프트 테스트.
  • 클라이언트 라이브러리가 지원하지 않는 형태로 멀티모달 콘텐츠 전달.

Python 예제

이 예제는 Novita AI의 OpenAI 호환 기본 URL과 함께 OpenAI Python SDK를 사용합니다.

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/openai/v1",
)

response = client.chat.completions.create(
    model="minimax/minimax-m3",
    messages=[
        {
            "role": "system",
            "content": "You are a concise API assistant for software teams.",
        },
        {
            "role": "user",
            "content": "Summarize the main implementation risks in a long-context code review process.",
        },
    ],
    temperature=0.2,
    max_tokens=600,
)

answer = response.choices[0].message.content
print(answer)

cURL로 요청 보내기

cURL을 선호하는 경우 JSON 본문을 payload 변수에 보관하세요. 이렇게 하면 요청을 더 쉽게 읽을 수 있고 전체 JSON 본문을 단일 명령에 밀어 넣지 않아도 됩니다.

payload='{
  "model": "minimax/minimax-m3",
  "messages": [
    {
      "role": "system",
      "content": "You are a concise API assistant for software teams."
    },
    {
      "role": "user",
      "content": "Summarize the main implementation risks in a long-context code review process."
    }
  ],
  "temperature": 0.2,
  "max_tokens": 600
}'

curl --request POST "https://api.novita.ai/openai/v1/chat/completions" \
  --header "Authorization: Bearer $NOVITA_API_KEY" \
  --header "Content-Type: application/json" \
  --data "$payload"

주요 매개변수

매개변수 제어 대상 시작 값
model 요청에 응답하는 호스팅된 모델 minimax/minimax-m3
messages 시스템 및 사용자 지침 짧은 텍스트 전용 프롬프트
temperature 출력 변동성 반복 가능한 테스트를 위해 0.2
max_tokens 생성된 최대 출력 작은 제한, 나중에 높임
stream 토큰이 점진적으로 스트리밍되는지 여부 기본 호출이 작동한 후 활성화
tools 함수/도구 정의 한 번에 하나의 도구 추가
response_format 구조화된 응답 형태 사용하기 전에 출력 유효성 검사

멀티모달 입력의 경우 이미지 또는 비디오 프롬프트에 의존하기 전에 SDK 또는 API 문서에서 정확한 요청 형태를 확인하세요. 모델 페이지는 모달리티 지원을 나열하지만 요청 형식은 사용하는 클라이언트 경로에 따라 다릅니다.

문제 해결

인증 실패

요청을 실행하는 동일한 셸 또는 런타임에 NOVITA_API_KEY가 설정되어 있는지 확인하세요. 권한 부여 헤더는 bearer-token 형식을 사용해야 합니다.

API가 모델을 찾을 수 없음

요청이 minimax/minimax-m3을 사용하는지 확인하세요. MiniMax M3, minimax-m3 또는 블로그 제목이 아닌지 확인하세요. 모델 표시 이름과 모델 ID는 상호 교환할 수 없습니다.

짧은 프롬프트에서는 작동하지만 긴 프롬프트에서는 실패

보이는 단어 수뿐만 아니라 직렬화된 입력을 측정하세요. 도구 스키마, 검색된 문서, 이미지 참조 및 대화 기록이 모두 포함됩니다. 1,000,000 토큰에 가까워지면 더 작은 프롬프트를 시도하고 재시도하기 전에 잘림 또는 검색 논리를 추가하세요.

청구 금액이 예상보다 높음

프롬프트가 524,288~1,000,000 토큰 가격 대역에 진입했는지 확인하세요. MiniMax M3는 해당 긴 컨텍스트 계층에서 더 높은 입력, 출력 및 캐시 읽기 가격을 가지고 있습니다.

구조화된 출력이 일관되지 않음

더 작은 스키마, 낮은 온도 및 명시적 유효성 검사로 시작하세요. 애플리케이션에 엄격한 JSON이 필요한 경우 모든 응답이 구문 분석될 것이라고 가정하는 대신 유효성 검사 및 재시도 논리로 잘못된 응답을 처리하세요.

도구 호출이 함수 스키마와 일치하지 않음

한 번에 하나의 도구를 테스트하세요. 함수 이름, 설명 및 매개변수 스키마를 명확하게 유지하고 도구 호출을 실행하기 전에 서버 측 유효성 검사를 추가하세요.

FAQ

MiniMax M3를 Novita AI API를 통해 사용할 수 있나요?

네. 현재 Novita AI 모델 페이지는 MiniMax M3를 모델 ID minimax/minimax-m3로 서버리스 API 액세스를 통해 사용할 수 있다고 나열합니다.

MiniMax M3의 모델 ID는 무엇인가요?

minimax/minimax-m3를 사용하세요.

어떤 기본 URL을 사용해야 하나요?

https://api.novita.ai/openai를 OpenAI 호환 기본 URL로 사용하세요. OpenAI SDK에서 SDK 기본 URL을 https://api.novita.ai/openai/v1로 설정하세요.

Novita AI에서 MiniMax M3 비용은 얼마인가요?

MiniMax M3 가격은 계층화되어 있습니다. 524,288 토큰 미만 프롬프트의 경우 입력은 1M 토큰당 $0.30, 출력은 1M 토큰당 $1.20, 캐시 읽기는 1M 토큰당 $0.06입니다. 524,288 ~ 1,000,000 토큰 프롬프트의 경우 입력은 1M 토큰당 $1.20, 출력은 1M 토큰당 $4.80, 캐시 읽기는 1M 토큰당 $0.24입니다.

MiniMax M3는 스트리밍 또는 멀티모달 입력을 지원하나요?

현재 모델 페이지는 텍스트, 이미지 및 비디오 입력과 텍스트 출력을 나열합니다. 스트리밍 동작은 프로덕션 사용 전에 OpenAI 호환 채팅 완료 경로를 통해 테스트해야 합니다.

최대 컨텍스트 창은 얼마인가요?

MiniMax M3는 현재 1,000,000 토큰 컨텍스트 창과 최대 출력 131,072 토큰을 가지고 있습니다.