Novita AI를 통해 Claude Code에서 MiniMax M2.7 사용하기

Novita AI를 통해 Claude Code에서 MiniMax M2.7 사용하기

MiniMax M2.7은 Novita AI에서 Anthropic 호환 엔드포인트를 통해 사용할 수 있으며, 이는 네 개의 환경 변수만 설정하면 다른 변경 없이 Claude Code에서 바로 사용할 수 있음을 의미합니다. 입력 비용은 백만 토큰당 0.3달러로 — Claude Opus 4.6보다 약 23배 저렴합니다 — 또한 이 모델은 40개 이상의 동시 도구에서 97%의 도구 호출 정확도를 유지합니다. 이 가이드에서는 정확한 설정, 검증된 사양, 비용 계산, 그리고 도입 전에 알아야 할 절충점을 다룹니다.

빠른 답변: Claude Code를 실행하기 전에 ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic, ANTHROPIC_AUTH_TOKEN=<your key>, ANTHROPIC_MODEL=minimax/minimax-m2.7을 설정하세요. 이것이 전체 통합입니다.

Novita AI에서 MiniMax M2.7 사용해 보기

M2.7이 Claude Code 백엔드로 작동하는 이유

Claude Code는 모든 파일 읽기, 터미널 명령, 편집을 도구 호출을 통해 라우팅합니다. 이 모델은 단순한 프롬프트뿐만 아니라 긴 다단계 세션에서도 이러한 도구를 안정적으로 호출해야 합니다.

M2.7의 주요 지표는 각 정의가 2,000토큰을 초과하는 40개 이상의 동시 도구에서 97%의 스킬 수행 정확도를 보여줍니다. 이는 Read, Write, Edit, Bash, Glob, Grep, WebFetch 등 Claude Code의 도구 표면에 직접 매핑됩니다. 도구 준수가 약한 모델은 매개변수를 누락하거나 세션 중간에 잘못된 함수를 호출하는 반면, M2.7은 정확도를 유지합니다.

또 다른 관련 지표는 컨텍스트 창인 204,800 토큰입니다. 이는 대규모 코드베이스, 대화 기록, 도구 결과를 강제 압축 없이 컨텍스트에 유지하기에 충분합니다.

Claude Code에서 M2.7이 강점을 보이는 분야:

  • 지속적인 도구 체인이 필요한 다중 파일 리팩터링
  • 프로덕션 디버깅 워크플로우 (로그 분석 → 데이터베이스 쿼리 → 수정)
  • SWE-Bench 스타일 작업: SWE-Bench Pro 56.2%, Multi-SWE-Bench 52.7%
  • 역할 일관성을 유지하며 다중 턴 추론이 필요한 에이전트 워크플로우
  • 비용에 민감한 팀이 많은 동시 세션을 실행해야 하는 경우

기대치를 조정해야 할 부분:

  • 텍스트 전용 입력 모달리티 (이미지나 파일 업로드 불가)
  • 204,800 토큰 컨텍스트는 크지만 M3의 1M 티어보다는 작음
  • 자체 호스팅 배포에는 상당한 GPU가 필요 — API 접근이 실용적인 경로

Novita AI의 MiniMax M2.7 API 사양

필드
모델 ID minimax/minimax-m2.7
Anthropic 기본 URL https://api.novita.ai/anthropic
OpenAI 기본 URL https://api.novita.ai/openai/v1
컨텍스트 창 204,800 토큰
최대 출력 131,072 토큰
입력 모달리티 텍스트
출력 모달리티 텍스트
지원 기능 함수 호출, 구조화된 출력, 추론, JSON 모드, Anthropic API 호환
입력 가격 백만 토큰당 $0.30
출력 가격 백만 토큰당 $1.20
캐시 읽기 가격 백만 토큰당 $0.06
확인 날짜 2026-07-03, 출처: Novita AI 모델 페이지Novita의 MiniMax M2.7

Anthropic 호환 엔드포인트(/anthropic)는 Claude Code에서 사용됩니다. OpenAI 호환 엔드포인트는 직접 API 호출 및 기타 도구에서 사용할 수 있습니다.

1단계: Novita AI API 키 얻기

  1. novita.ai로 이동하여 계정 생성 (무료 가입)
  2. 설정 → API 키 로 이동
  3. 새 키 생성 클릭, 이름 지정(예: claude-code-m2.7), 키 복사
  4. 키를 소스 코드, 공개 저장소, 공유 노트북에 저장하지 마세요

하드코딩 대신 환경 변수로 저장하세요:

export NOVITA_API_KEY="your_key_here"

2단계: Claude Code 설치

Claude Code가 이미 설치되어 있다면 3단계로 건너뛰세요.

macOS, Linux 또는 WSL:

curl -fsSL https://claude.ai/install.sh | bash

Windows PowerShell:

irm https://claude.ai/install.ps1 | iex

Windows CMD:

curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd

Windows 사용자는 먼저 Windows용 Git을 설치해야 합니다.

설치 확인:

claude --version

3단계: 환경 변수 구성

Claude Code는 네 가지 변수를 읽어 사용자 정의 모델 엔드포인트로 요청을 라우팅합니다. Claude Code를 실행하기 전에 모두 설정하세요.

macOS 및 Linux:

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<your Novita API key>"
export ANTHROPIC_MODEL="minimax/minimax-m2.7"
export ANTHROPIC_SMALL_FAST_MODEL="minimax/minimax-m2.7"

Windows PowerShell:

$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "<your Novita API key>"
$env:ANTHROPIC_MODEL = "minimax/minimax-m2.7"
$env:ANTHROPIC_SMALL_FAST_MODEL = "minimax/minimax-m2.7"

ANTHROPIC_SMALL_FAST_MODEL은 파일 탐색, 빠른 검색과 같은 가벼운 작업을 제어합니다. 동일한 모델로 설정하면 모든 요청이 동일한 결제 경로와 가격으로 처리됩니다.

구성을 영구적으로 유지하려면 export 라인을 셸 프로필(~/.bashrc, ~/.zshrc, PowerShell 프로필)에 추가하세요. 또는 프로젝트 수준의 .env 파일을 유지하고 각 세션 전에 소싱하세요. 단, 커밋하지 마세요.

4단계: Claude Code 실행 및 확인

프로젝트 디렉터리로 이동하여 Claude Code를 시작하세요:

cd your-project-directory
claude .

프롬프트에서 간단한 테스트를 실행하세요:

> 이 디렉터리에는 어떤 파일이 있나요?

모델이 적절한 도구를 호출하여 파일 목록으로 응답하면 통합이 작동하는 것입니다. 사용 중인 모델을 확인하고 각 요청의 토큰 비용은 Novita AI 사용량 대시보드에서 확인할 수 있습니다.

인증 오류가 발생하면 ANTHROPIC_AUTH_TOKEN이 현재 셸 세션에 설정되어 있는지 다시 확인하세요. 다른 터미널 창에만 설정된 것은 아닌지 확인하세요.

5단계: 에이전틱 워크플로우 최적화

M2.7의 97% 도구 준수율과 204,800 토큰 컨텍스트는 장시간 에이전트 세션에 적합합니다. 이러한 기능을 최대한 활용하기 위한 몇 가지 방법은 다음과 같습니다:

먼저 전체 코드베이스 컨텍스트를 모델에 제공하세요. 변경을 요청하기 전에 Claude Code가 관련 파일을 읽게 하세요. M2.7의 큰 컨텍스트 창 덕분에 제한에 도달하기 전에 여러 모듈을 로드할 수 있습니다.

> src/api/의 모든 파일을 읽고 인증을 처리하는 함수를 식별하세요

복잡한 작업에 명시적인 작업 분해를 사용하세요. 큰 요청을 순차적인 단계로 나누면 부분 출력이나 세션 중 혼란 가능성이 줄어듭니다:

> 먼저 현재 데이터베이스 스키마를 분석하세요. 그런 다음 소프트 삭제를 추가하는 데 필요한 마이그레이션을 제안하세요. 아직 코드를 작성하지 마세요.

디버깅에 도구 체인을 활용하세요. M2.7의 프로덕션 디버깅 강점은 다단계 시퀀스(재현 → 추적 → 수정 → 확인)에서 가장 잘 드러납니다.

> 테스트 스위트를 실행하고, 실패하는 테스트를 식별하고, 소스 코드에서 근본 원인을 찾고, 수정 방안을 제안하세요

세션을 집중해서 유지하세요. M2.7은 다중 턴 일관성을 잘 처리하지만, 명확한 목표를 가진 좁은 세션은 방향을 반복적으로 바꾸는 개방형 탐색 세션보다 더 안정적인 출력을 생성합니다.

비용 분석

백만 토큰당 $0.3/$1.2(입력/출력)인 M2.7은 에이전틱 벤치마크에서 경쟁력을 유지하면서 대부분의 최첨단 옵션보다 상당히 저렴합니다.

Novita AI를 통한 M2.7의 일반적인 Claude Code 워크플로우 비용:

워크플로우 예상 비용
소규모 리팩터링 (5개 파일, 약 200줄 변경) $0.02–$0.05
기능 구현 (20개 파일, 약 1000줄) $0.10–$0.20
전체 코드베이스 분석 (100개 이상의 파일) $0.25–$0.60
초당 100토큰으로 1시간 연속 코딩 약 $0.27

Claude Code 사용을 위한 모델 비용 비교:

모델 입력(백만 토큰당) 출력(백만 토큰당) M2.7 입력 대비 배율
MiniMax M2.7 (Novita AI) $0.30 $1.20
MiniMax M2.5 (Novita AI) $0.30 $1.20 동일
GLM-5 (Novita AI) $1.00 $3.20 3.3배
Claude Opus 4.6 약 $7.00 약 $21.00 23배

출처: Novita AI 모델 페이지, 2026-07-03 확인. 프로덕션 워크로드 예산을 책정하기 전에 현재 가격을 확인하세요.

프롬프트 캐싱을 사용하면 반복되는 컨텍스트에서 비용을 더욱 절감할 수 있습니다. 캐시 읽기 비용이 백만 토큰당 $0.06이므로, 안정적인 시스템 프롬프트나 큰 공유 컨텍스트가 있는 워크로드에서 큰 이점을 얻을 수 있습니다.

실제 사용 사례

다중 파일 리팩터링. M2.7의 Multi-SWE-Bench 52.7%는 복잡한 파일 간 변경을 처리할 수 있음을 보여줍니다. Claude Code는 대화형 승인 계층을 제공합니다. 각 제안된 변경 사항을 커밋하기 전에 검토하세요.

프로덕션 SRE 및 장애 대응. 이 모델은 프로덕션 디버깅 시나리오(메트릭 상관 분석, 데이터베이스 쿼리, 근본 원인 추적, 비차단 수정 적용)에 대해 학습되었습니다. Claude Code의 터미널 통합을 통해 동일한 세션에서 진단을 실행하고 수정을 확인할 수 있습니다.

에이전트 프레임워크 개발. 다른 도구나 모델을 오케스트레이션하는 무언가를 구축 중이라면 M2.7의 네이티브 Agent Teams 지원과 역할 일관성은 오케스트레이터 계층에 적합한 선택입니다. 원시 벤치마크 점수보다 97%의 도구 준수율이 여기에서 더 중요합니다.

다중 언어 코드베이스. M2.7은 여러 프로그래밍 언어에서 강력한 성능을 보여주며, 주로 Python/JavaScript로 학습된 모델에서 가끔 볼 수 있는 품질 저하 없이 다국어 프로젝트를 처리합니다.

에이전틱 워크플로우를 확장하는 비용에 민감한 팀. 입력당 $0.30/Mt인 M2.7을 사용하면 여러 개발자가 지속적으로 Claude Code 세션을 실행하는 팀도 크게 약화된 모델로 전환하지 않고도 비용을 관리할 수 있습니다.

문제 해결

인증 오류 (401)

ANTHROPIC_AUTH_TOKEN이 활성 셸 세션에 설정되어 있는지 확인하세요. claude .를 실행하기 전에 변수를 내보내야 합니다. 키가 손상되었다고 의심되면 키를 다시 생성하고 다시 내보내는 것이 가장 빠른 해결책입니다.

모델을 찾을 수 없음

모델 ID가 정확히 minimax/minimax-m2.7인지 확인하세요. 공백이나 대소문자 변경이 없어야 합니다. MiniMax M2.7과 같은 표시 이름은 모델 ID로 작동하지 않습니다.

Novita 대신 Anthropic으로 요청이 전달됨

ANTHROPIC_BASE_URLhttps://api.novita.ai/anthropic으로 설정되어 있는지 확인하세요. 변수가 없거나 비어 있으면 Claude Code가 Anthropic의 엔드포인트로 폴백하고 유효한 Anthropic 키 없이 요청을 거부합니다.

첫 번째 요청 시 응답 느림

세션의 첫 번째 요청은 콜드 스타트 동작으로 인해 몇 초 더 걸릴 수 있습니다. 동일한 세션의 후속 요청은 일반적으로 더 빠릅니다. 요청 간에 느린 현상이 지속되면 테스트 호출에서 max_tokens를 줄여 생성 시간인지 네트워크 대기 시간인지 구분해 보세요.

컨텍스트 창 오류

M2.7은 204,800 토큰을 지원합니다. 매우 큰 코드베이스를 로드하는 경우 Claude Code의 컨텍스트 관리가 자동으로 압축을 처리합니다. 수동 제어가 필요하면 한 번에 Claude Code가 읽을 파일 수를 제한하세요.

예상보다 높은 비용

ANTHROPIC_SMALL_FAST_MODEL을 확인하세요. 다른, 더 비싼 모델을 가리키고 있다면 디렉터리 탐색과 같은 가벼운 작업 비용이 예상보다 많이 들 수 있습니다. 두 변수를 모두 minimax/minimax-m2.7로 설정하면 모든 트래픽이 정규화됩니다.

FAQ

MiniMax M2.7이 Anthropic 호환 엔드포인트와 함께 Novita AI에서 사용 가능한가요?

네. 이 모델은 minimax/minimax-m2.7로 OpenAI 호환 및 Anthropic 호환 엔드포인트 모두에서 사용할 수 있습니다. Claude Code는 https://api.novita.ai/anthropic의 Anthropic 경로를 사용합니다.

Claude Code 워크플로우에서 M2.7과 M2.5의 차이점은 무엇인가요?

M2.7은 모든 벤치마크에서 더 강력한 모델입니다: SWE-Bench Pro가 52.2%에서 56.2%로, Multi-SWE-Bench가 51.3%에서 52.7%로, MLE-Bench lite가 31.5%에서 66.6%로 향상되었습니다. 가격은 동일하므로(백만 토큰당 $0.3/$1.2) 새 설정에서 M2.5 대신 M2.7을 사용하지 않을 비용상의 이유는 없습니다.

M2.7은 Claude Code에서 비전이나 이미지 입력을 지원하나요?

아니요. MiniMax M2.7은 텍스트 전용입니다. 워크플로우에 스크린샷, UI 분석 또는 이미지 컨텍스트가 포함된 경우 멀티모달 모델이 필요합니다. 텍스트 기반 코딩 워크플로우의 경우 이 제한 사항은 적용되지 않습니다.

Claude Code에서 MCP 도구와 함께 M2.7을 사용할 수 있나요?

네. Claude Code의 MCP(Model Context Protocol) 지원은 모델 계층이 아닌 도구 계층에서 작동합니다. M2.7의 높은 도구 준수율은 MCP가 많은 설정에 적합한 후보입니다.

함수 호출이 Claude Code의 내장 도구에서 안정적으로 작동하나요?

네. M2.7은 높은 도구 호출 정확도를 위해 특별히 학습되었습니다. 프로덕션 조건에서 40개 이상의 동시 도구에 대해 97% 준수율을 보입니다. Claude Code의 내장 도구(Read, Write, Edit, Bash, Glob, Grep)는 그 범위 내에 있습니다.

이 설정은 Claude Code VS Code 확장에서도 작동하나요?

환경 변수는 CLI 런타임에 적용됩니다. VS Code 확장을 사용하는 경우 셸 프로필이나 VS Code의 통합 터미널 설정에 변수를 설정하여 확장이 Claude Code 세션을 시작할 때 사용할 수 있도록 하세요.

추천 문서

Novita AI의 MiniMax M2.7: 최고 수준의 지능, 예산 친화적인 가격 전체 출시 정보: M2.7의 자기 진화 아키텍처, 벤치마크 결과, 에이전트 기능, Novita AI에서 GLM-5 및 Kimi K2.5와의 가격 비교.

Claude Code에서 MiniMax M2.5 사용: 에이전틱 코딩 가이드 M2.5와 동일한 통합 패턴입니다. 워크플로우에 M2.5와 M2.7을 비교하거나 기존 M2.5 설정을 M2.7로 마이그레이션하는 경우 유용합니다.

Claude Code에서 GLM-5 사용 방법: 설정 가이드 Novita AI를 통해 Claude Code에서 GLM-5를 설정하는 가이드. 이 모델은 Intelligence Index에서 M2.7에 가장 가까운 벤치마크 점수를 보이지만 가격과 컨텍스트 크기가 다릅니다.


Novita AI는 개발자와 스타트업이 고성능, 안정성, 비용 효율성을 갖춘 모델과 에이전트 애플리케이션을 구축, 배포, 확장할 수 있도록 지원하는 AI 및 에이전트 클라우드 플랫폼입니다.