- Cuándo usar este inicio rápido
- Paso 1: Obtén tu clave API de Novita
- Paso 2: Confirma el ID de modelo y el endpoint
- Paso 3: Envía tu primera solicitud
- Paso 4: Lee la respuesta
- Paso 5: Revisa precios, límites y errores comunes
- Ejemplo en Python
- Envía la solicitud con cURL
- Parámetros clave
- Solución de problemas
- Preguntas Frecuentes
MiniMax M3 está disponible a través de Novita AI con el ID de modelo minimax/minimax-m3, una URL base compatible con OpenAI, una ventana de contexto de 1,000,000 de tokens y precios escalonados para indicaciones más largas. Este inicio rápido mantiene la configuración práctica: copia el ID de modelo, establece tu clave API, ejecuta una solicitud pequeña y luego escala a indicaciones más largas una vez que lo básico funcione.
Cuándo usar este inicio rápido
Usa este inicio rápido cuando quieras probar MiniMax M3 a través de una ruta de API sin servidor en lugar de construir alrededor del alojamiento directo del modelo. Está dirigido a desarrolladores que ya tienen una indicación o carga de trabajo en mente y necesitan el endpoint, el ID de modelo, los límites de tokens y los detalles de precios antes de escribir un pequeño prototipo.
MiniMax M3 es una buena opción cuando tu solicitud necesita un gran presupuesto de contexto, salida estructurada, tareas orientadas a herramientas o asistencia de codificación sobre entradas largas. En Novita AI, la página actual del modelo enumera text, image y video como modalidades de entrada aceptadas, text como modalidad de salida, y soporte para acceso sin servidor, llamada a funciones, salida estructurada, razonamiento y compatibilidad con la API de Anthropic.
Esto no es un análisis exhaustivo de rendimiento ni un anuncio de lanzamiento. El objetivo es más simple: realizar una solicitud limpia y luego decidir si MiniMax M3 se ajusta a tu aplicación.
Paso 1: Obtén tu clave API de Novita
Crea o selecciona una cuenta de Novita AI, abre la configuración de tu clave API y genera una clave para uso del lado del servidor. Mantén la clave fuera del código del lado del cliente, los paquetes frontend, los repositorios públicos y los cuadernos que puedan compartirse fuera de tu equipo.
Establece la clave como variable de entorno antes de ejecutar los ejemplos:
export NOVITA_API_KEY="tu_clave_api_aqui"
Si estás probando en un entorno de equipo, usa una clave de proyecto con alcance o una clave temporal si tu configuración de cuenta lo permite. Rota la clave después de demostraciones públicas, experimentos compartidos o cualquier exposición accidental.
Paso 2: Confirma el ID de modelo y el endpoint
Antes de escribir código, ten los detalles de conexión de MiniMax M3 en un solo lugar:
| Campo | Valor |
| ID de modelo | minimax/minimax-m3 |
| URL base | https://api.novita.ai/openai |
| URL de completado de chat | https://api.novita.ai/openai/v1/chat/completions |
| Ventana de contexto | 1,000,000 tokens |
| Salida máxima | 131,072 tokens |
| Entradas | Texto, imagen, video |
| Salida | Texto |
| Soporte sin servidor | Soportado |
| Llamada a funciones | Soportado |
| Salida estructurada | Soportado |
| Razonamiento | Soportado |
| Compatibilidad con API de Anthropic | Soportado |
Consulta la documentación del modelo MiniMax M3 antes de implementar, ya que la disponibilidad, los precios y los límites pueden cambiar.
Paso 3: Envía tu primera solicitud
Comienza con una solicitud de chat corta solo de texto. Es mucho más fácil depurar la autenticación, el enrutamiento y el análisis de la respuesta antes de agregar una indicación larga.
Para la primera indicación, pide una salida determinista y fácil de verificar. Por ejemplo: Resume los principales riesgos de implementación en un proceso de revisión de código de contexto largo.
Mantén max_tokens modesto para la primera llamada. MiniMax M3 admite salidas mucho más largas, pero el primer trabajo es confirmar que la integración funciona.
Paso 4: Lee la respuesta
Una respuesta de completado de chat compatible con OpenAI generalmente devuelve la respuesta del asistente en choices[0].message.content.
También registra el ID de solicitud o los metadatos de respuesta que exponga tu tiempo de ejecución. Estos detalles son útiles cuando una solicitud falla o se ejecuta lentamente. Para el seguimiento de costos, registra el tamaño de la indicación, el tamaño de salida, el uso de lectura de caché si tu carga de trabajo usa contexto en caché, y si la solicitud entró en la banda de precios de contexto largo.
No trates la primera salida como prueba de que tu indicación está lista para los usuarios. Una vez que la integración funcione, prueba indicaciones que se parezcan a tu carga de trabajo real: bases de código largas, instrucciones de múltiples archivos, esquemas de herramientas, salida JSON estructurada o entradas multimodales si tu aplicación las necesita.
Paso 5: Revisa precios, límites y errores comunes
MiniMax M3 usa precios escalonados en Novita AI. El precio cambia una vez que la indicación entra en la banda de contexto largo:
| Banda de tamaño de indicación | Entrada | Salida | Lectura de caché |
| Menos de 524,288 tokens | $0.30 por 1M tokens | $1.20 por 1M tokens | $0.06 por 1M tokens |
| 524,288 a 1,000,000 tokens | $1.20 por 1M tokens | $4.80 por 1M tokens | $0.24 por 1M tokens |
Esa división importa. Una prueba de 50,000 tokens y una solicitud de casi 1M de tokens no tienen el mismo precio. Cuando estimes el costo, incluye la longitud de la indicación, la longitud esperada de salida, el comportamiento de la caché, los reintentos y la frecuencia con la que los usuarios pueden enviar solicitudes muy grandes.
MiniMax M3 actualmente tiene una ventana de contexto de 1,000,000 tokens y una salida máxima de 131,072 tokens. Antes de implementar, vuelve a consultar la documentación del modelo MiniMax M3 para obtener la tabla de precios más reciente y cualquier guía de límite de tasa asociada a tu cuenta.
Los errores de configuración comunes incluyen:
- Falta o formato incorrecto del encabezado
Authorization. - Usar el ID de modelo incorrecto, como un nombre para mostrar en lugar de
minimax/minimax-m3. - Enviar solicitudes a la URL base incorrecta.
- Establecer
max_tokensmás alto de lo que tu aplicación puede consumir de manera segura. - Probar indicaciones de contexto largo sin tener en cuenta la banda de precios más alta.
- Pasar contenido multimodal en una forma que tu biblioteca cliente no admita.
Ejemplo en Python
Este ejemplo usa el SDK de OpenAI para Python con la URL base compatible con OpenAI de Novita AI.
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["NOVITA_API_KEY"],
base_url="https://api.novita.ai/openai/v1",
)
response = client.chat.completions.create(
model="minimax/minimax-m3",
messages=[
{
"role": "system",
"content": "Eres un asistente de API conciso para equipos de software.",
},
{
"role": "user",
"content": "Resume los principales riesgos de implementación en un proceso de revisión de código de contexto largo.",
},
],
temperature=0.2,
max_tokens=600,
)
answer = response.choices[0].message.content
print(answer)
Envía la solicitud con cURL
Si prefieres cURL, guarda el cuerpo JSON en una variable payload. Esto hace que la solicitud sea más fácil de leer y evita meter el cuerpo JSON completo en un solo comando.
payload='{
"model": "minimax/minimax-m3",
"messages": [
{
"role": "system",
"content": "Eres un asistente de API conciso para equipos de software."
},
{
"role": "user",
"content": "Resume los principales riesgos de implementación en un proceso de revisión de código de contexto largo."
}
],
"temperature": 0.2,
"max_tokens": 600
}'
curl --request POST "https://api.novita.ai/openai/v1/chat/completions" \
--header "Authorization: Bearer $NOVITA_API_KEY" \
--header "Content-Type: application/json" \
--data "$payload"
Parámetros clave
| Parámetro | Qué controla | Empieza con |
model |
Qué modelo alojado responde a la solicitud | minimax/minimax-m3 |
messages |
Instrucciones del sistema y del usuario | Una indicación corta solo de texto |
temperature |
Variabilidad de la salida | 0.2 para pruebas repetibles |
max_tokens |
Salida generada máxima | Un límite pequeño, luego aumentarlo después |
stream |
Si los tokens se transmiten progresivamente | Habilitar después de que la llamada básica funcione |
tools |
Definiciones de funciones/herramientas | Agregar una herramienta a la vez |
response_format |
Forma de respuesta estructurada | Validar la salida antes de usarla |
Para entradas multimodales, confirma la forma exacta de la solicitud en tu SDK o documentación de API antes de confiar en indicaciones de imagen o video. La página del modelo enumera la compatibilidad de modalidades, pero el formato de la solicitud depende de la ruta del cliente que uses.
Solución de problemas
La autenticación falla
Verifica que NOVITA_API_KEY esté configurada en el mismo shell o entorno de ejecución donde ejecutas la solicitud. El encabezado de autorización debe usar el formato de token Bearer.
La API no encuentra el modelo
Confirma que la solicitud use minimax/minimax-m3, no MiniMax M3, minimax-m3 ni un título de blog. Los nombres para mostrar del modelo y los ID de modelo no son intercambiables.
La solicitud funciona para indicaciones cortas pero falla para indicaciones largas
Mide la entrada serializada, no solo el recuento de palabras visible. Los esquemas de herramientas, documentos recuperados, referencias a imágenes e historial de conversaciones también cuentan. Si te estás acercando a 1,000,000 tokens, prueba con una indicación más pequeña y agrega lógica de truncamiento o recuperación antes de reintentar.
La factura es más alta de lo esperado
Verifica si la indicación entró en la banda de precios de 524,288 a 1,000,000 tokens. MiniMax M3 tiene precios de entrada, salida y lectura de caché más altos en ese nivel de contexto largo.
La salida estructurada es inconsistente
Comienza con un esquema más pequeño, temperatura más baja y validación explícita. Si tu aplicación requiere JSON estricto, maneja las respuestas mal formadas con validación y lógica de reintento en lugar de asumir que cada respuesta se analizará correctamente.
Las llamadas a herramientas no coinciden con tu esquema de funciones
Prueba una herramienta a la vez. Mantén los nombres de funciones, descripciones y esquemas de parámetros claros, y agrega validación del lado del servidor antes de ejecutar cualquier llamada a herramienta.
Preguntas Frecuentes
¿MiniMax M3 está disponible a través de la API de Novita AI?
Sí. La página actual del modelo de Novita AI enumera MiniMax M3 como disponible a través de acceso API sin servidor con el ID de modelo minimax/minimax-m3.
¿Cuál es el ID de modelo para MiniMax M3?
Usa minimax/minimax-m3.
¿Qué URL base debo usar?
Usa https://api.novita.ai/openai como la URL base compatible con OpenAI. En los SDK de OpenAI, establece la URL base del SDK en https://api.novita.ai/openai/v1.
¿Cuánto cuesta MiniMax M3 en Novita AI?
El precio de MiniMax M3 es escalonado. Para indicaciones por debajo de 524,288 tokens, la entrada es $0.30 por 1M tokens, la salida es $1.20 por 1M tokens y la lectura de caché es $0.06 por 1M tokens. Para indicaciones de 524,288 a 1,000,000 tokens, la entrada es $1.20 por 1M tokens, la salida es $4.80 por 1M tokens y la lectura de caché es $0.24 por 1M tokens.
¿MiniMax M3 admite transmisión o entrada multimodal?
La página actual del modelo enumera entradas de texto, imagen y video con salida de texto. El comportamiento de transmisión debe probarse a través de la ruta de completado de chat compatible con OpenAI antes del uso en producción.
¿Cuál es la ventana de contexto máxima?
MiniMax M3 actualmente tiene una ventana de contexto de 1,000,000 tokens y una salida máxima de 131,072 tokens.
