MiniMax-M1,全球首个开源混合注意力推理模型,现已登陆 Novita AI!这款突破性模型拥有 4560 亿参数 —— 每个 token 激活 459 亿参数 —— 并原生支持 100 万 token 上下文,是 DeepSeek R1 的 8 倍。
限时优惠,新用户可领取 $10 免费额度,立即探索 MiniMax-M1 的强大推理能力。借助先进的混合注意力技术赋能您的应用 —— 只需一个 API 调用即可使用 MiniMax-M1。
以下是 MiniMax-M1 在 Novita AI 上的当前定价:
MiniMax-M1-80K:每 100 万输入 token 为 $0.55,每 100 万输出 token 为 $2.2
MiniMax-M1 是什么?
MiniMax-M1 代表了大型语言模型架构的范式转变。这款由 MiniMax-AI 开发的创新模型,首次将混合 Mixture-of-Experts(MoE)架构与革命性的闪电注意力机制相结合,打造出世界上首个开源的大规模混合注意力推理系统。
MiniMax-M1 的主要特性
🔹 混合注意力与混合专家
MoE 层对每个 token 从 4560 亿参数中激活 459 亿参数,配合闪电注意力实现速度和效率的双重提升。
🔹 百万级 Token 上下文
原生支持高达 100 万个 token,非常适合总结书籍、日志和整个代码库。
🔹 高效强化学习
CISPO 通过裁剪重要性采样权重来提升 RL 训练效率 —— 这是 MoE + 混合注意力架构中的首创。
🔹 双重思考预算:40K 与 80K
根据所需的推理深度和计算权衡,选择 MiniMax‑M1‑40K 或 MiniMax‑M1‑80K。
🔹 智能体能力与插件
内置函数调用、工具访问(搜索、代码执行、图像/视频生成、TTS),为真实世界的智能体工作流进行了优化。
基准测试与性能分析
MiniMax-M1 在全面的 AI 基准测试中表现出色。标准评估表明,该模型优于 DeepSeek-R1 和 Qwen3-235B 等强大的开源替代方案,尤其在软件工程、工具使用和长上下文理解方面表现突出。
综合性能对比
| 类别 | 任务 | MiniMax-M1-80K | MiniMax-M1-40K | Qwen3-235B-A22B | DeepSeek-R1-0528 | DeepSeek-R1 | Seed-Thinking-v1.5 | Claude 4 Opus | Gemini 2.5 Pro | OpenAI-o3 |
|---|---|---|---|---|---|---|---|---|---|---|
| **扩展思考 ** | 80K | 40K | 32k | 64k | 32k | 32k | 64k | 64k | 100k | |
| **数学 ** | AIME 2024 | 86.0 | 83.3 | 85.7 | 91.4 | 79.8 | 86.7 | 76.0 | 92.0 | 91.6 |
| AIME 2025 | 76.9 | 74.6 | 81.5 | 87.5 | 70.0 | 74.0 | 75.5 | 88.0 | 88.9 | |
| MATH-500 | 96.8 | 96.0 | 96.2 | 98.0 | 97.3 | 96.7 | 98.2 | 98.8 | 98.1 | |
| **通用编程 ** | LiveCodeBench | 65.0 | 62.3 | 65.9 | 73.1 | 55.9 | 67.5 | 56.6 | 77.1 | 75.8 |
| FullStackBench | 68.3 | 67.6 | 62.9 | 69.4 | 70.1 | 69.9 | 70.3 | -- | 69.3 | |
| **推理与知识 ** | GPQA Diamond | 70.0 | 69.2 | 71.1 | 81.0 | 71.5 | 77.3 | 79.6 | 86.4 | 83.3 |
| ZebraLogic | 86.8 | 80.1 | 80.3 | 95.1 | 78.7 | 84.4 | 95.1 | 91.6 | 95.8 | |
| MMLU-Pro | 81.1 | 80.6 | 83.0 | 85.0 | 84.0 | 87.0 | 85.0 | 86.0 | 85.0 | |
| **软件工程 ** | SWE-bench Verified | 56.0 | 55.6 | 34.4 | 57.6 | 49.2 | 47.0 | 72.5 | 67.2 | 69.1 |
| **长上下文 ** | OpenAI-MRCR (128k) | 73.4 | 76.1 | 27.7 | 51.5 | 35.8 | 54.3 | 48.9 | 76.8 | 56.5 |
| OpenAI-MRCR (1M) | 56.2 | 58.6 | -- | -- | -- | -- | -- | 58.8 | -- | |
| LongBench-v2 | 61.5 | 61.0 | 50.1 | 52.1 | 58.3 | 52.5 | 55.6 | 65.0 | 58.8 | |
| **智能体工具使用 ** | TAU-bench (航空) | 62.0 | 60.0 | 34.7 | 53.5 | -- | 44.0 | 59.6 | 50.0 | 52.0 |
| TAU-bench (零售) | 63.5 | 67.8 | 58.6 | 63.9 | -- | 55.7 | 81.4 | 67.0 | 73.9 |
模型评估参数:temperature=1.0, top_p=0.95
数学与推理卓越性
竞赛级数学
MiniMax-M1-80K 在 AIME 2024(86.0)和 AIME 2025(76.9)上取得出色成绩,在开源推理模型中数学推理领先。该模型在 MATH-500 上达到 96.8% 的准确率,展现了处理复杂数学问题的卓越能力。
高级推理任务
该模型在 ZebraLogic 上以 86.8% 的性能大幅超越 Qwen3-235B(80.3%)和 DeepSeek-R1(78.7%)等开源替代方案。80K 和 40K 两个版本在 MMLU-Pro 上的一致表现(81.1% 和 80.6%)展示了可靠的推理能力。
软件工程与编程卓越性
真实世界软件开发
MiniMax-M1 在 SWE-bench Verified 上取得 56.0% 的显著成绩,大幅领先 Qwen3-235B-A22B(34.4%)。这一表现证明了该模型理解复杂代码库、识别问题并提出有效解决方案的能力。
编程多样性
在 LiveCodeBench(65.0%)和 FullStackBench(68.3%)上的强劲表现凸显了该模型在多种编程范式和框架下的通用性,使其成为软件开发应用中的领先选择。
长上下文与智能体优势
扩展上下文处理
MiniMax-M1 在长上下文理解方面表现出色。在 OpenAI-MRCR (128k) 上达到 73.4%,远超其他开源模型,如 Qwen3-235B-A22B(27.7%)。百万 token 能力(56.2%)展示了在超长序列中保持一致性的独特能力。
智能体能力
在 TAU-bench 上的强劲表现(航空 62.0%,零售 63.5%)大幅领先 Qwen3-235B-A22B 的航空任务(34.7%),展示了跨领域应用中的竞争性智能体能力。
性能领先分析

领先商业模型和开源模型在竞赛级数学、编程、软件工程、智能体工具使用和长上下文理解任务上的基准性能对比。MiniMax AI 在此图中使用 MiniMax-M1-80k 代表 MiniMax-M1。
开源领先
MiniMax-M1 在各个基准类别中持续优于开源竞争者,确立了在开源推理模型领域的领先地位。
上下文长度优势
百万 token 上下文带来巨大优势,在长上下文任务上与其他方案的性能差距超过 45 个百分点。
商业竞争力
虽然商业模型在某些类别中得分更高,但 MiniMax-M1 以开源可用性和部署灵活性优势提供了竞争性性能。
如何在 Novita AI 上使用 MiniMax-M1
在 Novita AI 上开始使用 MiniMax-M1 非常简单且无风险。新用户可获得 $10 免费额度——足以探索 MiniMax-M1 的混合注意力推理能力、构建原型并启动初始用例,无需前期成本。
使用 Playground(无需编码)
即时访问:注册,领取免费额度,立即开始使用 Qwen 3 及其他顶级模型。
交互式界面:测试提示词、思维链推理,并实时可视化结果。
模型对比:轻松在 Qwen 3、Llama 4、DeepSeek 等模型之间切换,找到最适合您需求的模型。
通过 API 集成(面向开发者)
使用 Novita AI 的统一 REST API,将 MiniMax-M1 无缝集成到应用程序、工作流或聊天机器人中。无需管理模型权重或操心基础设施——Novita AI 提供多语言 SDK(Python、Node.js、cURL)和高级参数控制。
选项 1:直接 API 集成(Python 示例)
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="session_T3FM6wKgMO4YSk7lWfKo5H99EzvOqeJYVrxM6W1u2kuckMW0MuJhSAGDv9jNsFJ09pQ8r6mJHXJoldr_gxQ4WA==",
)
model = "minimaxai/minimax-m1-80k"
stream = True # or False
max_tokens = 20000
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
选项 2:使用 OpenAI Agents SDK 构建多智能体工作流
通过将 Novita AI 与 OpenAI Agents SDK 集成,构建高级多智能体系统:
- 即插即用:在任何 OpenAI Agents 工作流中使用 Novita AI 的 MiniMax-M1
- 支持移交、路由和工具使用:设计能够委派、分流或运行函数的智能体,全部由 MiniMax-M1 的混合注意力能力驱动
- Python 集成:只需将 SDK 指向 Novita 的端点(
https://api.novita.ai/v3/openai)并使用您的 API 密钥即可
在第三方平台上连接 MiniMax-M1 API
-
Hugging Face:通过 Novita AI 端点在 Spaces、pipeline 或 Transformers 库中使用 MiniMax-M1。
-
智能体与编排框架:通过官方连接器和逐步集成指南,轻松将 Novita AI 与 Continue、AnythingLLM、LangChain、Dify 和 Langflow 等合作伙伴平台连接。
-
兼容 OpenAI 的 API:与 Cline 和 Cursor 等工具无缝迁移和集成,这些工具专为 OpenAI API 标准设计。
总结
MiniMax-M1 通过其混合注意力架构和跨领域的卓越表现,为开源推理模型树立了新标杆。
该模型拥有 100 万 token 上下文能力和 75% 的 FLOP 减少,非常适合需要高效与高级推理的复杂真实世界应用。
准备好体验 AI 推理的未来?立即在 Novita AI 上试用 MiniMax-M1 并 领取您的 $10 免费额度。
Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 部署 AI 模型的便捷方式,同时提供经济实惠且可靠的 GPU 云用于构建。
