Usa MiniMax M2.7 en Claude Code a través de Novita AI

Usa MiniMax M2.7 en Claude Code a través de Novita AI

MiniMax M2.7 está disponible en Novita AI con un endpoint compatible con Anthropic, lo que significa que puedes integrarlo en Claude Code con cuatro variables de entorno y sin otros cambios. El costo de entrada es de $0.3 por millón de tokens — aproximadamente 23 veces más barato que Claude Opus 4.6 — mientras que el modelo mantiene un 97% de precisión en llamadas a herramientas con más de 40 herramientas concurrentes. Esta guía cubre la configuración exacta, especificaciones verificadas, cálculos de costos y las ventajas y desventajas que vale la pena conocer antes de comprometerte.

Respuesta rápida: Configura ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic, ANTHROPIC_AUTH_TOKEN=<tu clave> y ANTHROPIC_MODEL=minimax/minimax-m2.7 antes de iniciar Claude Code. Esa es la integración completa.

Prueba MiniMax M2.7 en Novita AI

Por qué M2.7 funciona como backend de Claude Code

Claude Code enruta cada lectura de archivo, comando de terminal y edición a través de llamadas a herramientas. El modelo subyacente debe invocar esas herramientas de manera confiable en sesiones largas y de varios pasos, no solo en prompts simples.

El dato destacado de M2.7 es un 97% de precisión en el seguimiento de habilidades con más de 40 herramientas concurrentes, cada una con definiciones que superan los 2,000 tokens. Esto se corresponde directamente con la superficie de herramientas de Claude Code: Read, Write, Edit, Bash, Glob, Grep, WebFetch y más. Mientras que modelos con adherencia más débil a herramientas pierden parámetros o invocan la función incorrecta en mitad de la sesión, M2.7 mantiene su precisión.

El otro número relevante es la ventana de contexto: 204,800 tokens. Esto es suficiente para mantener un código base grande, el historial de la conversación y los resultados de las herramientas en contexto sin necesidad de compactación forzada a mitad de tarea.

En qué destaca M2.7 en Claude Code:

  • Refactorizaciones de múltiples archivos que requieren encadenamiento sostenido de herramientas
  • Flujos de trabajo de depuración en producción (análisis de logs → consultas a bases de datos → corrección)
  • Tareas tipo SWE-Bench: 56.2% en SWE-Bench Pro, 52.7% en Multi-SWE-Bench
  • Flujos de trabajo de agentes que necesitan razonamiento coherente en múltiples turnos y roles consistentes
  • Equipos sensibles a costos que ejecutan muchas sesiones concurrentes

Dónde ajustar las expectativas:

  • Modalidad de entrada solo texto (sin carga de imágenes o archivos al modelo)
  • Contexto de 204,800 tokens es grande pero no el nivel de 1M de M3
  • El despliegue auto-alojado requiere GPU significativa: el acceso por API es la ruta práctica

Especificaciones de la API MiniMax M2.7 en Novita AI

Campo Valor
ID del modelo minimax/minimax-m2.7
URL base Anthropic https://api.novita.ai/anthropic
URL base OpenAI https://api.novita.ai/openai/v1
Ventana de contexto 204,800 tokens
Salida máxima 131,072 tokens
Modalidades de entrada Texto
Modalidades de salida Texto
Funciones compatibles Llamada a funciones, salida estructurada, razonamiento, modo JSON, compatibilidad con API Anthropic
Precio de entrada $0.30 por 1M tokens
Precio de salida $1.20 por 1M tokens
Precio de lectura de caché $0.06 por 1M tokens
Fecha de verificación 2026-07-03, fuente: Página del modelo Novita AI y MiniMax M2.7 en Novita

El endpoint compatible con Anthropic (/anthropic) es el que utiliza Claude Code. El endpoint compatible con OpenAI funciona para llamadas directas a la API y otras herramientas.

Paso 1: Obtén tu clave de API de Novita AI

  1. Ve a novita.ai y crea una cuenta (registro gratuito)
  2. Navega a Settings → API Keys
  3. Haz clic en Create New Key, ponle un nombre (por ejemplo, claude-code-m2.7) y copia la clave
  4. Mantén la clave fuera del código fuente, repositorios públicos y notebooks compartidos

Guárdala como variable de entorno en lugar de codificarla en ningún lugar:

export NOVITA_API_KEY="tu_clave_aqui"

Paso 2: Instala Claude Code

Si ya tienes Claude Code instalado, salta al Paso 3.

macOS, Linux o WSL:

curl -fsSL https://claude.ai/install.sh | bash

Windows PowerShell:

irm https://claude.ai/install.ps1 | iex

Windows CMD:

curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd

Los usuarios de Windows necesitan tener Git for Windows instalado primero.

Verifica la instalación:

claude --version

Paso 3: Configura las variables de entorno

Claude Code lee cuatro variables para enrutar las solicitudes a un endpoint de modelo personalizado. Configúralas todas antes de iniciar Claude Code.

macOS y Linux:

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<tu clave de API de Novita>"
export ANTHROPIC_MODEL="minimax/minimax-m2.7"
export ANTHROPIC_SMALL_FAST_MODEL="minimax/minimax-m2.7"

Windows PowerShell:

$env:ANTHROPIC_BASE_URL = "https://api.novita.ai/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "<tu clave de API de Novita>"
$env:ANTHROPIC_MODEL = "minimax/minimax-m2.7"
$env:ANTHROPIC_SMALL_FAST_MODEL = "minimax/minimax-m2.7"

ANTHROPIC_SMALL_FAST_MODEL controla operaciones ligeras como navegación de archivos y búsquedas rápidas. Configurarlo al mismo modelo mantiene todas las solicitudes en la misma ruta de facturación y precio.

Para hacer la configuración persistente, agrega las líneas de exportación a tu perfil de shell (~/.bashrc, ~/.zshrc o perfil de PowerShell). O mantén un archivo .env a nivel de proyecto y cárgalo antes de cada sesión — solo no lo subas al repositorio.

Paso 4: Inicia Claude Code y verifica

Navega al directorio de tu proyecto e inicia Claude Code:

cd tu-directorio-de-proyecto
claude .

En el prompt, ejecuta una prueba rápida:

> ¿Qué archivos hay en este directorio?

Si el modelo responde con una lista de archivos invocando la herramienta adecuada, la integración está funcionando. Puedes confirmar el modelo en uso y verificar los costos de tokens por solicitud en tu panel de uso de Novita AI.

Si ves un error de autenticación, verifica que ANTHROPIC_AUTH_TOKEN esté configurado en la sesión actual del shell — no solo en una ventana de terminal diferente.

Paso 5: Optimiza para flujos de trabajo de agente

La adherencia del 97% a herramientas de M2.7 y su contexto de 204,800 tokens lo hacen muy adecuado para sesiones extensas de agente. Algunas prácticas que aprovechan mejor esas capacidades:

Proporciona al modelo todo el contexto del código base primero. Antes de pedir un cambio, deja que Claude Code lea los archivos relevantes. La gran ventana de contexto de M2.7 permite cargar múltiples módulos sin alcanzar límites temprano.

> Lee todos los archivos en src/api/ e identifica las funciones que manejan autenticación

Usa descomposición explícita de tareas para trabajos complejos. Dividir una solicitud grande en pasos secuenciales reduce la posibilidad de salida parcial o confusión a mitad de sesión:

> Primero, analiza el esquema actual de la base de datos. Luego propón la migración necesaria para agregar eliminaciones suaves. No escribas código todavía.

Aprovecha el encadenamiento de herramientas para depuración. La fortaleza de M2.7 en depuración en producción es más visible en secuencias de varios pasos: reproducir → rastrear → corregir → verificar.

> Ejecuta el conjunto de pruebas, identifica las pruebas fallidas, encuentra la causa raíz en el código fuente y propón una corrección

Mantén sesiones enfocadas. M2.7 maneja bien la coherencia en múltiples turnos, pero las sesiones más estrechas con objetivos claros producen resultados más confiables que las sesiones exploratorias abiertas que cambian de dirección repetidamente.

Análisis de costos

A $0.3/$1.2 por millón de tokens (entrada/salida), M2.7 es materialmente más barato que la mayoría de las opciones fronterizas, manteniéndose competitivo en benchmarks de agentes.

Costos típicos de flujos de trabajo de Claude Code con M2.7 a través de Novita AI:

Flujo de trabajo Costo estimado
Refactorización pequeña (5 archivos, ~200 líneas de cambio) $0.02–$0.05
Implementación de funcionalidad (20 archivos, ~1000 líneas) $0.10–$0.20
Análisis completo del código base (100+ archivos) $0.25–$0.60
Una hora de codificación continua a 100 tokens/seg ~$0.27

Comparación de costos de modelos para uso en Claude Code:

Modelo Entrada por 1M tokens Salida por 1M tokens vs. entrada de M2.7
MiniMax M2.7 (Novita AI) $0.30 $1.20
MiniMax M2.5 (Novita AI) $0.30 $1.20 igual
GLM-5 (Novita AI) $1.00 $3.20 3.3x más
Claude Opus 4.6 ~$7.00 ~$21.00 23x más

Fuentes: Páginas de modelo de Novita AI, verificadas el 2026-07-03. Verifica los precios actuales antes de presupuestar cargas de trabajo de producción.

El almacenamiento en caché de prompts reduce aún más los costos en contextos repetidos. A $0.06/Mt por lecturas de caché, las cargas de trabajo con prompts de sistema estables o contexto compartido grande se benefician significativamente.

Casos de uso del mundo real

Refactorización de múltiples archivos. El 52.7% de M2.7 en Multi-SWE-Bench muestra que puede manejar cambios complejos entre archivos. Claude Code proporciona la capa de aprobación interactiva: revisa cada cambio propuesto antes de confirmarlo.

SRE en producción y respuesta a incidentes. El modelo fue entrenado en escenarios de depuración en producción: correlacionar métricas, consultar bases de datos, rastrear causas raíz y aplicar correcciones no bloqueantes. La integración de terminal de Claude Code le permite ejecutar diagnósticos y verificar correcciones en la misma sesión.

Desarrollo de marcos de agentes. Si estás construyendo algo que orquesta otras herramientas o modelos, el soporte nativo de Agent Teams de M2.7 y su consistencia de roles lo convierten en una opción sólida para la capa de orquestación. Su adherencia del 97% a herramientas importa más aquí que las puntuaciones brutas de benchmarks.

Código base políglota. M2.7 muestra un rendimiento sólido en múltiples lenguajes de programación y maneja proyectos multilingüe sin la caída de calidad que a veces se ve en modelos entrenados principalmente en Python/JavaScript.

Equipos sensibles al costo escalando flujos de trabajo de agentes. A $0.30/Mt de entrada, los equipos que ejecutan sesiones continuas de Claude Code entre múltiples desarrolladores pueden mantener los costos manejables sin caer a un modelo significativamente más débil.

Solución de problemas

Error de autenticación (401)

Verifica que ANTHROPIC_AUTH_TOKEN esté configurado en la sesión activa del shell. La variable debe exportarse antes de ejecutar claude .. Regenerar la clave y volver a exportarla es la solución más rápida si sospechas corrupción de la clave.

Modelo no encontrado

Confirma que el ID del modelo sea exactamente minimax/minimax-m2.7 — sin espacios ni cambios de mayúsculas. Los nombres mostrados como MiniMax M2.7 no funcionan como ID de modelo.

Solicitudes que llegan a Anthropic en lugar de Novita

Verifica que ANTHROPIC_BASE_URL esté configurado en https://api.novita.ai/anthropic. Si la variable falta o está en blanco, Claude Code recurre al endpoint de Anthropic y rechazará las solicitudes sin una clave válida de Anthropic.

Respuestas lentas en la primera solicitud

La primera solicitud en una sesión puede tardar unos segundos adicionales debido al comportamiento de inicio en frío. Las solicitudes posteriores en la misma sesión suelen ser más rápidas. Si la lentitud persiste en varias solicitudes, intenta reducir max_tokens en las llamadas de prueba para aislar si es tiempo de generación o latencia de red.

Errores de ventana de contexto

M2.7 soporta 204,800 tokens. Si estás cargando códigos base muy grandes, la gestión de contexto de Claude Code manejará la compactación automáticamente. Para control manual, limita los archivos que le pides a Claude Code que lea en un solo turno.

Costos más altos de lo esperado

Revisa ANTHROPIC_SMALL_FAST_MODEL. Si apunta a un modelo diferente y más caro, las operaciones ligeras como la navegación de directorios costarán más de lo esperado. Configurar ambas variables en minimax/minimax-m2.7 normaliza todo el tráfico.

Preguntas frecuentes

¿Está disponible MiniMax M2.7 en Novita AI con el endpoint compatible con Anthropic?

Sí. El modelo está disponible como minimax/minimax-m2.7 con endpoints compatibles tanto con OpenAI como con Anthropic. Claude Code usa la ruta de Anthropic en https://api.novita.ai/anthropic.

¿Cuál es la diferencia entre M2.7 y M2.5 para flujos de trabajo de Claude Code?

M2.7 es el modelo más fuerte en todos los benchmarks: SWE-Bench Pro mejoró de 52.2% a 56.2%, Multi-SWE-Bench de 51.3% a 52.7%, y MLE-Bench lite de 31.5% a 66.6%. El precio es el mismo ($0.3/$1.2 por millón de tokens), por lo que no hay razón de costo para usar M2.5 sobre M2.7 en nuevas configuraciones.

¿M2.7 soporta entrada de visión o imágenes en Claude Code?

No. MiniMax M2.7 es solo texto. Si tu flujo de trabajo involucra capturas de pantalla, análisis de interfaz de usuario o contexto de imágenes, necesitarías un modelo multimodal. Para flujos de trabajo de codificación basados en texto, esta limitación no aplica.

¿Puedo usar M2.7 en Claude Code junto con herramientas MCP?

Sí. El soporte de MCP (Model Context Protocol) de Claude Code funciona a nivel de herramientas, no a nivel de modelo. La alta adherencia a herramientas de M2.7 lo convierte en un buen candidato para configuraciones con énfasis en MCP.

¿La llamada a funciones funciona de manera confiable para las herramientas integradas de Claude Code?

Sí. M2.7 fue entrenado específicamente para alta precisión en llamadas a herramientas: 97% de adherencia en más de 40 herramientas concurrentes en condiciones de producción. Las herramientas integradas de Claude Code (Read, Write, Edit, Bash, Glob, Grep) están dentro de ese rango.

¿Funcionará esta configuración con la extensión de VS Code de Claude Code?

Las variables de entorno se aplican al tiempo de ejecución de la CLI. Si estás usando la extensión de VS Code, configura las variables en tu perfil de shell o en la configuración de terminal integrada de VS Code para que estén disponibles cuando la extensión inicie una sesión de Claude Code.

Artículos recomendados

MiniMax M2.7 en Novita AI: Inteligencia de primer nivel, precio económico Cobertura completa del lanzamiento: arquitectura de auto-evolución de M2.7, resultados de benchmarks, capacidades de agente y comparación de precios con GLM-5 y Kimi K2.5 en Novita AI.

Usa MiniMax M2.5 en Claude Code: Guía de codificación con agente Mismo patrón de integración para M2.5 — útil si estás comparando M2.5 y M2.7 para tu flujo de trabajo, o migrando una configuración existente de M2.5 a M2.7.

Cómo usar GLM-5 en Claude Code: Guía de configuración Guía de configuración para GLM-5 en Claude Code a través de Novita AI — el modelo que más se acerca a M2.7 en el Intelligence Index, con un precio y tamaño de contexto diferentes.


Novita AI es la plataforma en la nube de IA y agentes que ayuda a desarrolladores y startups a construir, desplegar y escalar modelos y aplicaciones de agentes con alto rendimiento, fiabilidad y eficiencia de costos.