Inicio Rápido de la API de MiniMax M3 con Novita AI

Tabla de contenido

Cuándo usar este inicio rápido
Paso 1: Obtén tu clave API de Novita
Paso 2: Confirma el ID de modelo y el endpoint
Paso 3: Envía tu primera solicitud
Paso 4: Lee la respuesta
Paso 5: Revisa precios, límites y errores comunes
Ejemplo en Python
Envía la solicitud con cURL
Parámetros clave
Solución de problemas
Preguntas Frecuentes

MiniMax M3 está disponible a través de Novita AI con el ID de modelo minimax/minimax-m3, una URL base compatible con OpenAI, una ventana de contexto de 1,000,000 de tokens y precios escalonados para indicaciones más largas. Este inicio rápido mantiene la configuración práctica: copia el ID de modelo, establece tu clave API, ejecuta una solicitud pequeña y luego escala a indicaciones más largas una vez que lo básico funcione.

Cuándo usar este inicio rápido

Usa este inicio rápido cuando quieras probar MiniMax M3 a través de una ruta de API sin servidor en lugar de construir alrededor del alojamiento directo del modelo. Está dirigido a desarrolladores que ya tienen una indicación o carga de trabajo en mente y necesitan el endpoint, el ID de modelo, los límites de tokens y los detalles de precios antes de escribir un pequeño prototipo.

MiniMax M3 es una buena opción cuando tu solicitud necesita un gran presupuesto de contexto, salida estructurada, tareas orientadas a herramientas o asistencia de codificación sobre entradas largas. En Novita AI, la página actual del modelo enumera text, image y video como modalidades de entrada aceptadas, text como modalidad de salida, y soporte para acceso sin servidor, llamada a funciones, salida estructurada, razonamiento y compatibilidad con la API de Anthropic.

Esto no es un análisis exhaustivo de rendimiento ni un anuncio de lanzamiento. El objetivo es más simple: realizar una solicitud limpia y luego decidir si MiniMax M3 se ajusta a tu aplicación.

Paso 1: Obtén tu clave API de Novita

Crea o selecciona una cuenta de Novita AI, abre la configuración de tu clave API y genera una clave para uso del lado del servidor. Mantén la clave fuera del código del lado del cliente, los paquetes frontend, los repositorios públicos y los cuadernos que puedan compartirse fuera de tu equipo.

Establece la clave como variable de entorno antes de ejecutar los ejemplos:

export NOVITA_API_KEY="tu_clave_api_aqui"

Si estás probando en un entorno de equipo, usa una clave de proyecto con alcance o una clave temporal si tu configuración de cuenta lo permite. Rota la clave después de demostraciones públicas, experimentos compartidos o cualquier exposición accidental.

Paso 2: Confirma el ID de modelo y el endpoint

Antes de escribir código, ten los detalles de conexión de MiniMax M3 en un solo lugar:


Campo	Valor
ID de modelo	`minimax/minimax-m3`
URL base	`https://api.novita.ai/openai`
URL de completado de chat	`https://api.novita.ai/openai/v1/chat/completions`
Ventana de contexto	1,000,000 tokens
Salida máxima	131,072 tokens
Entradas	Texto, imagen, video
Salida	Texto
Soporte sin servidor	Soportado
Llamada a funciones	Soportado
Salida estructurada	Soportado
Razonamiento	Soportado
Compatibilidad con API de Anthropic	Soportado

Consulta la documentación del modelo MiniMax M3 antes de implementar, ya que la disponibilidad, los precios y los límites pueden cambiar.

Paso 3: Envía tu primera solicitud

Comienza con una solicitud de chat corta solo de texto. Es mucho más fácil depurar la autenticación, el enrutamiento y el análisis de la respuesta antes de agregar una indicación larga.

Para la primera indicación, pide una salida determinista y fácil de verificar. Por ejemplo: Resume los principales riesgos de implementación en un proceso de revisión de código de contexto largo.

Mantén max_tokens modesto para la primera llamada. MiniMax M3 admite salidas mucho más largas, pero el primer trabajo es confirmar que la integración funciona.

Paso 4: Lee la respuesta

Una respuesta de completado de chat compatible con OpenAI generalmente devuelve la respuesta del asistente en choices[0].message.content.

También registra el ID de solicitud o los metadatos de respuesta que exponga tu tiempo de ejecución. Estos detalles son útiles cuando una solicitud falla o se ejecuta lentamente. Para el seguimiento de costos, registra el tamaño de la indicación, el tamaño de salida, el uso de lectura de caché si tu carga de trabajo usa contexto en caché, y si la solicitud entró en la banda de precios de contexto largo.

No trates la primera salida como prueba de que tu indicación está lista para los usuarios. Una vez que la integración funcione, prueba indicaciones que se parezcan a tu carga de trabajo real: bases de código largas, instrucciones de múltiples archivos, esquemas de herramientas, salida JSON estructurada o entradas multimodales si tu aplicación las necesita.

Paso 5: Revisa precios, límites y errores comunes

MiniMax M3 usa precios escalonados en Novita AI. El precio cambia una vez que la indicación entra en la banda de contexto largo:


Banda de tamaño de indicación	Entrada	Salida	Lectura de caché
Menos de 524,288 tokens	$0.30 por 1M tokens	$1.20 por 1M tokens	$0.06 por 1M tokens
524,288 a 1,000,000 tokens	$1.20 por 1M tokens	$4.80 por 1M tokens	$0.24 por 1M tokens

Esa división importa. Una prueba de 50,000 tokens y una solicitud de casi 1M de tokens no tienen el mismo precio. Cuando estimes el costo, incluye la longitud de la indicación, la longitud esperada de salida, el comportamiento de la caché, los reintentos y la frecuencia con la que los usuarios pueden enviar solicitudes muy grandes.

MiniMax M3 actualmente tiene una ventana de contexto de 1,000,000 tokens y una salida máxima de 131,072 tokens. Antes de implementar, vuelve a consultar la documentación del modelo MiniMax M3 para obtener la tabla de precios más reciente y cualquier guía de límite de tasa asociada a tu cuenta.

Los errores de configuración comunes incluyen:

Falta o formato incorrecto del encabezado Authorization.
Usar el ID de modelo incorrecto, como un nombre para mostrar en lugar de minimax/minimax-m3.
Enviar solicitudes a la URL base incorrecta.
Establecer max_tokens más alto de lo que tu aplicación puede consumir de manera segura.
Probar indicaciones de contexto largo sin tener en cuenta la banda de precios más alta.
Pasar contenido multimodal en una forma que tu biblioteca cliente no admita.

Ejemplo en Python

Este ejemplo usa el SDK de OpenAI para Python con la URL base compatible con OpenAI de Novita AI.

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["NOVITA_API_KEY"],
    base_url="https://api.novita.ai/openai/v1",
)

response = client.chat.completions.create(
    model="minimax/minimax-m3",
    messages=[
        {
            "role": "system",
            "content": "Eres un asistente de API conciso para equipos de software.",
        },
        {
            "role": "user",
            "content": "Resume los principales riesgos de implementación en un proceso de revisión de código de contexto largo.",
        },
    ],
    temperature=0.2,
    max_tokens=600,
)

answer = response.choices[0].message.content
print(answer)

Envía la solicitud con cURL

Si prefieres cURL, guarda el cuerpo JSON en una variable payload. Esto hace que la solicitud sea más fácil de leer y evita meter el cuerpo JSON completo en un solo comando.

payload='{
  "model": "minimax/minimax-m3",
  "messages": [
    {
      "role": "system",
      "content": "Eres un asistente de API conciso para equipos de software."
    },
    {
      "role": "user",
      "content": "Resume los principales riesgos de implementación en un proceso de revisión de código de contexto largo."
    }
  ],
  "temperature": 0.2,
  "max_tokens": 600
}'

curl --request POST "https://api.novita.ai/openai/v1/chat/completions" \
  --header "Authorization: Bearer $NOVITA_API_KEY" \
  --header "Content-Type: application/json" \
  --data "$payload"

Parámetros clave


Parámetro	Qué controla	Empieza con
`model`	Qué modelo alojado responde a la solicitud	`minimax/minimax-m3`
`messages`	Instrucciones del sistema y del usuario	Una indicación corta solo de texto
`temperature`	Variabilidad de la salida	`0.2` para pruebas repetibles
`max_tokens`	Salida generada máxima	Un límite pequeño, luego aumentarlo después
`stream`	Si los tokens se transmiten progresivamente	Habilitar después de que la llamada básica funcione
`tools`	Definiciones de funciones/herramientas	Agregar una herramienta a la vez
`response_format`	Forma de respuesta estructurada	Validar la salida antes de usarla

Para entradas multimodales, confirma la forma exacta de la solicitud en tu SDK o documentación de API antes de confiar en indicaciones de imagen o video. La página del modelo enumera la compatibilidad de modalidades, pero el formato de la solicitud depende de la ruta del cliente que uses.

Solución de problemas

La autenticación falla

Verifica que NOVITA_API_KEY esté configurada en el mismo shell o entorno de ejecución donde ejecutas la solicitud. El encabezado de autorización debe usar el formato de token Bearer.

La API no encuentra el modelo

Confirma que la solicitud use minimax/minimax-m3, no MiniMax M3, minimax-m3 ni un título de blog. Los nombres para mostrar del modelo y los ID de modelo no son intercambiables.

La solicitud funciona para indicaciones cortas pero falla para indicaciones largas

Mide la entrada serializada, no solo el recuento de palabras visible. Los esquemas de herramientas, documentos recuperados, referencias a imágenes e historial de conversaciones también cuentan. Si te estás acercando a 1,000,000 tokens, prueba con una indicación más pequeña y agrega lógica de truncamiento o recuperación antes de reintentar.

La factura es más alta de lo esperado

Verifica si la indicación entró en la banda de precios de 524,288 a 1,000,000 tokens. MiniMax M3 tiene precios de entrada, salida y lectura de caché más altos en ese nivel de contexto largo.

La salida estructurada es inconsistente

Comienza con un esquema más pequeño, temperatura más baja y validación explícita. Si tu aplicación requiere JSON estricto, maneja las respuestas mal formadas con validación y lógica de reintento en lugar de asumir que cada respuesta se analizará correctamente.

Las llamadas a herramientas no coinciden con tu esquema de funciones

Prueba una herramienta a la vez. Mantén los nombres de funciones, descripciones y esquemas de parámetros claros, y agrega validación del lado del servidor antes de ejecutar cualquier llamada a herramienta.

Preguntas Frecuentes

¿MiniMax M3 está disponible a través de la API de Novita AI?

Sí. La página actual del modelo de Novita AI enumera MiniMax M3 como disponible a través de acceso API sin servidor con el ID de modelo minimax/minimax-m3.

¿Cuál es el ID de modelo para MiniMax M3?

Usa minimax/minimax-m3.

¿Qué URL base debo usar?

Usa https://api.novita.ai/openai como la URL base compatible con OpenAI. En los SDK de OpenAI, establece la URL base del SDK en https://api.novita.ai/openai/v1.

¿Cuánto cuesta MiniMax M3 en Novita AI?

El precio de MiniMax M3 es escalonado. Para indicaciones por debajo de 524,288 tokens, la entrada es $0.30 por 1M tokens, la salida es $1.20 por 1M tokens y la lectura de caché es $0.06 por 1M tokens. Para indicaciones de 524,288 a 1,000,000 tokens, la entrada es $1.20 por 1M tokens, la salida es $4.80 por 1M tokens y la lectura de caché es $0.24 por 1M tokens.

¿MiniMax M3 admite transmisión o entrada multimodal?

La página actual del modelo enumera entradas de texto, imagen y video con salida de texto. El comportamiento de transmisión debe probarse a través de la ruta de completado de chat compatible con OpenAI antes del uso en producción.

¿Cuál es la ventana de contexto máxima?

MiniMax M3 actualmente tiene una ventana de contexto de 1,000,000 tokens y una salida máxima de 131,072 tokens.

Inicio Rápido de la API de MiniMax M3 con Novita AI

Cuándo usar este inicio rápido

Paso 1: Obtén tu clave API de Novita

Paso 2: Confirma el ID de modelo y el endpoint

Paso 3: Envía tu primera solicitud

Paso 4: Lee la respuesta

Paso 5: Revisa precios, límites y errores comunes

Ejemplo en Python

Envía la solicitud con cURL

Parámetros clave

Solución de problemas

La autenticación falla

La API no encuentra el modelo

La solicitud funciona para indicaciones cortas pero falla para indicaciones largas

La factura es más alta de lo esperado

La salida estructurada es inconsistente

Las llamadas a herramientas no coinciden con tu esquema de funciones

Preguntas Frecuentes

¿MiniMax M3 está disponible a través de la API de Novita AI?

¿Cuál es el ID de modelo para MiniMax M3?

¿Qué URL base debo usar?

¿Cuánto cuesta MiniMax M3 en Novita AI?

¿MiniMax M3 admite transmisión o entrada multimodal?

¿Cuál es la ventana de contexto máxima?

Product

RESOURCES

Partners

Company

Cuándo usar este inicio rápido

Paso 1: Obtén tu clave API de Novita

Paso 2: Confirma el ID de modelo y el endpoint

Paso 3: Envía tu primera solicitud

Paso 4: Lee la respuesta

Paso 5: Revisa precios, límites y errores comunes

Ejemplo en Python

Envía la solicitud con cURL

Parámetros clave

Solución de problemas

La autenticación falla

La API no encuentra el modelo

La solicitud funciona para indicaciones cortas pero falla para indicaciones largas

La factura es más alta de lo esperado

La salida estructurada es inconsistente

Las llamadas a herramientas no coinciden con tu esquema de funciones

Preguntas Frecuentes

¿MiniMax M3 está disponible a través de la API de Novita AI?

¿Cuál es el ID de modelo para MiniMax M3?

¿Qué URL base debo usar?

¿Cuánto cuesta MiniMax M3 en Novita AI?

¿MiniMax M3 admite transmisión o entrada multimodal?

¿Cuál es la ventana de contexto máxima?

Publicaciones relacionadas

Product

RESOURCES

Partners

Company