MiniMax-M1, el primer modelo de razonamiento con atención híbrida de peso abierto del mundo, ya está disponible en Novita AI. Este modelo innovador cuenta con 456 mil millones de parámetros —de los cuales 45.9 mil millones se activan por token— y soporta de forma nativa un contexto de 1 millón de tokens, 8 veces mayor que DeepSeek R1.
Por tiempo limitado, los nuevos usuarios pueden reclamar $10 en créditos gratuitos para explorar las capacidades avanzadas de razonamiento de MiniMax-M1. Potencia tus aplicaciones con tecnología de atención híbrida de vanguardia: MiniMax-M1 está a solo una llamada API de distancia.
Estos son los precios actuales de MiniMax-M1 en Novita AI:
MiniMax-M1-80K: $0.55 / M tokens de entrada, $2.2 / M tokens de salida
Prueba la demo de MiniMax-M1-80K ahora
¿Qué es MiniMax-M1?
MiniMax-M1 representa un cambio de paradigma en la arquitectura de los modelos de lenguaje grandes. Desarrollado por MiniMax-AI, este modelo innovador introduce el primer sistema de razonamiento con atención híbrida a gran escala y peso abierto del mundo, que combina una arquitectura híbrida de mezcla de expertos (MoE) con un revolucionario mecanismo de atención relámpago.
Características principales de MiniMax-M1
🔹 Atención híbrida y mezcla de expertos
Las capas MoE activan 45.9 mil millones de parámetros de 456 mil millones por cada token, combinadas con atención relámpago para velocidad y eficiencia.
🔹 Contexto masivo de 1 millón de tokens
Soporta hasta un millón de tokens de forma nativa, ideal para resumir libros, registros y bases de código completas.
🔹 Aprendizaje por refuerzo eficiente
CISPO mejora la eficiencia del entrenamiento con RL al recortar los pesos de muestreo por importancia — una primicia para la arquitectura MoE + atención híbrida.
🔹 Presupuestos de pensamiento dual: 40K y 80K
Elige entre MiniMax‑M1‑40K o MiniMax‑M1‑80K según la profundidad de razonamiento requerida y las compensaciones de cómputo.
🔹 Capacidades de agente y plugins
Llamada a funciones integrada, acceso a herramientas (búsqueda, ejecución de código, generación de imágenes/video, TTS), optimizado para flujos de trabajo de agentes del mundo real.
Evaluaciones comparativas y análisis de rendimiento
MiniMax-M1 ofrece un rendimiento excepcional en evaluaciones integrales de IA. Las evaluaciones estándar demuestran que el modelo supera a alternativas de peso abierto sólidas como DeepSeek-R1 y Qwen3-235B, destacando especialmente en ingeniería de software, uso de herramientas y comprensión de contexto largo.
Comparativa completa de rendimiento
| Categoría | Tarea | MiniMax-M1-80K | MiniMax-M1-40K | Qwen3-235B-A22B | DeepSeek-R1-0528 | DeepSeek-R1 | Seed-Thinking-v1.5 | Claude 4 Opus | Gemini 2.5 Pro | OpenAI-o3 |
|---|---|---|---|---|---|---|---|---|---|---|
| Pensamiento extendido | 80K | 40K | 32k | 64k | 32k | 32k | 64k | 64k | 100k | |
| Matemáticas | AIME 2024 | 86.0 | 83.3 | 85.7 | 91.4 | 79.8 | 86.7 | 76.0 | 92.0 | 91.6 |
| AIME 2025 | 76.9 | 74.6 | 81.5 | 87.5 | 70.0 | 74.0 | 75.5 | 88.0 | 88.9 | |
| MATH-500 | 96.8 | 96.0 | 96.2 | 98.0 | 97.3 | 96.7 | 98.2 | 98.8 | 98.1 | |
| Codificación general | LiveCodeBench | 65.0 | 62.3 | 65.9 | 73.1 | 55.9 | 67.5 | 56.6 | 77.1 | 75.8 |
| FullStackBench | 68.3 | 67.6 | 62.9 | 69.4 | 70.1 | 69.9 | 70.3 | -- | 69.3 | |
| Razonamiento y conocimiento | GPQA Diamond | 70.0 | 69.2 | 71.1 | 81.0 | 71.5 | 77.3 | 79.6 | 86.4 | 83.3 |
| ZebraLogic | 86.8 | 80.1 | 80.3 | 95.1 | 78.7 | 84.4 | 95.1 | 91.6 | 95.8 | |
| MMLU-Pro | 81.1 | 80.6 | 83.0 | 85.0 | 84.0 | 87.0 | 85.0 | 86.0 | 85.0 | |
| Ingeniería de software | SWE-bench Verified | 56.0 | 55.6 | 34.4 | 57.6 | 49.2 | 47.0 | 72.5 | 67.2 | 69.1 |
| Contexto largo | OpenAI-MRCR (128k) | 73.4 | 76.1 | 27.7 | 51.5 | 35.8 | 54.3 | 48.9 | 76.8 | 56.5 |
| OpenAI-MRCR (1M) | 56.2 | 58.6 | -- | -- | -- | -- | -- | 58.8 | -- | |
| LongBench-v2 | 61.5 | 61.0 | 50.1 | 52.1 | 58.3 | 52.5 | 55.6 | 65.0 | 58.8 | |
| Uso de herramientas de agente | TAU-bench (aerolínea) | 62.0 | 60.0 | 34.7 | 53.5 | -- | 44.0 | 59.6 | 50.0 | 52.0 |
| TAU-bench (venta minorista) | 63.5 | 67.8 | 58.6 | 63.9 | -- | 55.7 | 81.4 | 67.0 | 73.9 |
Modelos evaluados con temperature=1.0, top_p=0.95
Excelencia en matemáticas y razonamiento
Matemáticas de nivel competitivo
MiniMax-M1-80K obtiene resultados sobresalientes en AIME 2024 (86.0) y AIME 2025 (76.9), liderando entre los modelos de peso abierto en razonamiento matemático. La precisión del 96.8% en MATH-500 demuestra una capacidad excepcional para manejar problemas matemáticos complejos con precisión.
Tareas de razonamiento avanzado
El modelo sobresale en ZebraLogic con un rendimiento del 86.8%, superando significativamente a alternativas de peso abierto como Qwen3-235B (80.3%) y DeepSeek-R1 (78.7%). El rendimiento consistente en ambas variantes de 80K y 40K (81.1% y 80.6% en MMLU-Pro) demuestra capacidades de razonamiento fiables.
Excelencia en ingeniería de software y codificación
Desarrollo de software del mundo real
MiniMax-M1 alcanza una notable precisión del 56.0% en SWE-bench Verified, superando drásticamente a Qwen3-235B-A22B (34.4%). Este rendimiento demuestra la capacidad del modelo para comprender bases de código complejas, identificar problemas y proponer soluciones efectivas en escenarios reales.
Versatilidad en codificación
El sólido rendimiento en LiveCodeBench (65.0%) y FullStackBench (68.3%) destaca la versatilidad del modelo en diferentes paradigmas y marcos de programación, consolidándolo como una opción líder para aplicaciones de desarrollo de software.
Procesamiento de contexto largo y superioridad en capacidades de agente
Procesamiento de contexto extendido
MiniMax-M1 demuestra una comprensión excepcional de contextos largos. En OpenAI-MRCR (128k), alcanza un 73.4%, superando drásticamente a otros modelos de peso abierto como Qwen3-235B-A22B (27.7%). La capacidad de 1 millón de tokens (56.2%) muestra un mantenimiento de coherencia único en secuencias extremadamente largas.
Capacidades de agente
El sólido rendimiento en TAU-bench (62.0% en aerolínea, 63.5% en venta minorista) supera significativamente a Qwen3-235B-A22B en tareas de aerolínea (34.7%), demostrando capacidades de agente competitivas en aplicaciones de diferentes dominios.
Análisis de liderazgo en rendimiento

Comparativa de rendimiento en evaluaciones de modelos comerciales y de peso abierto líderes en matemáticas de nivel competitivo, codificación, ingeniería de software, uso de herramientas de agente y comprensión de contexto largo. MiniMax AI utiliza el modelo MiniMax-M1-80k para MiniMax-M1.
Dominio de peso abierto
MiniMax-M1 supera consistentemente a los competidores de peso abierto en todas las categorías de evaluación, estableciendo un claro liderazgo en el espacio de modelos de razonamiento de peso abierto.
Ventaja en longitud de contexto
El contexto de 1 millón de tokens proporciona ventajas sustanciales, con diferencias de rendimiento de más de 45 puntos porcentuales en comparación con alternativas en tareas de contexto largo.
Competitividad comercial
Si bien los modelos comerciales obtienen puntuaciones más altas en algunas categorías, MiniMax-M1 ofrece un rendimiento competitivo con la ventaja de ser de peso abierto y ofrecer flexibilidad de implementación.
Cómo acceder a MiniMax-M1 en Novita AI
Comenzar con MiniMax-M1 en Novita AI es sencillo y sin riesgos. Los nuevos usuarios reciben $10 en créditos gratuitos —suficiente para explorar las capacidades de razonamiento con atención híbrida de MiniMax-M1, crear prototipos e iniciar casos de uso sin costos iniciales.
Usa el Playground (sin necesidad de codificación)
Acceso inmediato: Regístrate, reclama tus créditos gratuitos y comienza a experimentar con Qwen 3 y otros modelos top en segundos.
Interfaz interactiva: Prueba prompts, razonamiento en cadena de pensamiento y visualiza resultados en tiempo real.
Comparación de modelos: Cambia fácilmente entre Qwen 3, Llama 4, DeepSeek y más para encontrar el ajuste perfecto para tus necesidades.
Integra mediante API (para desarrolladores)
Conecta MiniMax-M1 sin problemas a aplicaciones, flujos de trabajo o chatbots usando la API REST unificada de Novita AI. Sin necesidad de gestionar pesos de modelos ni preocuparte por la infraestructura: Novita AI proporciona SDKs en varios lenguajes (Python, Node.js, cURL) y controles avanzados de parámetros.
Opción 1: Integración directa con API (Ejemplo en Python)
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="session_T3FM6wKgMO4YSk7lWfKo5H99EzvOqeJYVrxM6W1u2kuckMW0MuJhSAGDv9jNsFJ09pQ8r6mJHXJoldr_gxQ4WA==",
)
model = "minimaxai/minimax-m1-80k"
stream = True # or False
max_tokens = 20000
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Opción 2: Flujos de trabajo multiagente con OpenAI Agents SDK
Construye sistemas multiagente avanzados integrando Novita AI con el OpenAI Agents SDK:
- Plug-and-play: Usa MiniMax-M1 de Novita AI en cualquier flujo de trabajo de OpenAI Agents
- Soporta traspasos, enrutamiento y uso de herramientas: Diseña agentes que puedan delegar, clasificar o ejecutar funciones, todo potenciado por las capacidades de atención híbrida de MiniMax-M1
- Integración en Python: Simplemente apunta el SDK al endpoint de Novita (
https://api.novita.ai/v3/openai) y usa tu clave API
Conecta la API de MiniMax-M1 en plataformas de terceros
-
Hugging Face: Usa Qwen 3 en Spaces, pipelines o con la biblioteca Transformers a través de los endpoints de Novita AI.
-
**Frameworks de agentes y orquestación:**Conecta fácilmente Novita AI con plataformas asociadas como Continue, AnythingLLM,LangChain, Dify y Langflow a través de conectores oficiales y guías de integración paso a paso.
-
API compatible con OpenAI: Disfruta de una migración e integración sin complicaciones con herramientas como Cline y Cursor, diseñadas para el estándar de la API de OpenAI.
Conclusión
MiniMax-M1 establece un nuevo punto de referencia para los modelos de razonamiento de peso abierto gracias a su arquitectura de atención híbrida y su rendimiento excepcional en diversos dominios.
La capacidad de contexto de 1 millón de tokens y la reducción del 75% en FLOP hacen que este modelo sea ideal para aplicaciones complejas del mundo real que requieren tanto eficiencia como razonamiento avanzado.
¿Listo para experimentar el futuro del razonamiento con IA? Prueba MiniMax-M1 en Novita AI y reclama tus $10 en créditos gratuitos hoy.
Novita AI es una plataforma de nube de IA que ofrece a los desarrolladores una forma sencilla de implementar modelos de IA usando nuestra API simple, al mismo tiempo que proporciona la nube de GPU asequible y confiable para construir y escalar.
