MiniMax-M1 现已登陆 Novita AI —— 体验混合注意力推理

MiniMax-M1 现已登陆 Novita AI —— 体验混合注意力推理

MiniMax-M1,全球首个开源混合注意力推理模型,现已登陆 Novita AI!这款突破性模型拥有 4560 亿参数 —— 每个 token 激活 459 亿参数 —— 并原生支持 100 万 token 上下文,是 DeepSeek R1 的 8 倍。

限时优惠,新用户可领取 $10 免费额度,立即探索 MiniMax-M1 的强大推理能力。借助先进的混合注意力技术赋能您的应用 —— 只需一个 API 调用即可使用 MiniMax-M1。

以下是 MiniMax-M1 在 Novita AI 上的当前定价:

MiniMax-M1-80K:每 100 万输入 token 为 $0.55,每 100 万输出 token 为 $2.2

立即试用 MiniMax-M1-80K 演示

MiniMax-M1 是什么?

MiniMax-M1 代表了大型语言模型架构的范式转变。这款由 MiniMax-AI 开发的创新模型,首次将混合 Mixture-of-Experts(MoE)架构与革命性的闪电注意力机制相结合,打造出世界上首个开源的大规模混合注意力推理系统。

MiniMax-M1 的主要特性

🔹 混合注意力与混合专家

MoE 层对每个 token 从 4560 亿参数中激活 459 亿参数,配合闪电注意力实现速度和效率的双重提升。

🔹 百万级 Token 上下文

原生支持高达 100 万个 token,非常适合总结书籍、日志和整个代码库。

🔹 高效强化学习

CISPO 通过裁剪重要性采样权重来提升 RL 训练效率 —— 这是 MoE + 混合注意力架构中的首创。

🔹 双重思考预算:40K 与 80K

根据所需的推理深度和计算权衡,选择 MiniMax‑M1‑40K 或 MiniMax‑M1‑80K。

🔹 智能体能力与插件

内置函数调用、工具访问(搜索、代码执行、图像/视频生成、TTS),为真实世界的智能体工作流进行了优化。

基准测试与性能分析

MiniMax-M1 在全面的 AI 基准测试中表现出色。标准评估表明,该模型优于 DeepSeek-R1 和 Qwen3-235B 等强大的开源替代方案,尤其在软件工程、工具使用和长上下文理解方面表现突出。

综合性能对比

类别 任务 MiniMax-M1-80K MiniMax-M1-40K Qwen3-235B-A22B DeepSeek-R1-0528 DeepSeek-R1 Seed-Thinking-v1.5 Claude 4 Opus Gemini 2.5 Pro OpenAI-o3
**扩展思考 ** 80K 40K 32k 64k 32k 32k 64k 64k 100k
**数学 ** AIME 2024 86.0 83.3 85.7 91.4 79.8 86.7 76.0 92.0 91.6
AIME 2025 76.9 74.6 81.5 87.5 70.0 74.0 75.5 88.0 88.9
MATH-500 96.8 96.0 96.2 98.0 97.3 96.7 98.2 98.8 98.1
**通用编程 ** LiveCodeBench 65.0 62.3 65.9 73.1 55.9 67.5 56.6 77.1 75.8
FullStackBench 68.3 67.6 62.9 69.4 70.1 69.9 70.3 -- 69.3
**推理与知识 ** GPQA Diamond 70.0 69.2 71.1 81.0 71.5 77.3 79.6 86.4 83.3
ZebraLogic 86.8 80.1 80.3 95.1 78.7 84.4 95.1 91.6 95.8
MMLU-Pro 81.1 80.6 83.0 85.0 84.0 87.0 85.0 86.0 85.0
**软件工程 ** SWE-bench Verified 56.0 55.6 34.4 57.6 49.2 47.0 72.5 67.2 69.1
**长上下文 ** OpenAI-MRCR (128k) 73.4 76.1 27.7 51.5 35.8 54.3 48.9 76.8 56.5
OpenAI-MRCR (1M) 56.2 58.6 -- -- -- -- -- 58.8 --
LongBench-v2 61.5 61.0 50.1 52.1 58.3 52.5 55.6 65.0 58.8
**智能体工具使用 ** TAU-bench (航空) 62.0 60.0 34.7 53.5 -- 44.0 59.6 50.0 52.0
TAU-bench (零售) 63.5 67.8 58.6 63.9 -- 55.7 81.4 67.0 73.9

模型评估参数:temperature=1.0, top_p=0.95

数学与推理卓越性

竞赛级数学
MiniMax-M1-80K 在 AIME 2024(86.0)和 AIME 2025(76.9)上取得出色成绩,在开源推理模型中数学推理领先。该模型在 MATH-500 上达到 96.8% 的准确率,展现了处理复杂数学问题的卓越能力。

高级推理任务
该模型在 ZebraLogic 上以 86.8% 的性能大幅超越 Qwen3-235B(80.3%)和 DeepSeek-R1(78.7%)等开源替代方案。80K 和 40K 两个版本在 MMLU-Pro 上的一致表现(81.1% 和 80.6%)展示了可靠的推理能力。

软件工程与编程卓越性

真实世界软件开发
MiniMax-M1 在 SWE-bench Verified 上取得 56.0% 的显著成绩,大幅领先 Qwen3-235B-A22B(34.4%)。这一表现证明了该模型理解复杂代码库、识别问题并提出有效解决方案的能力。

编程多样性
在 LiveCodeBench(65.0%)和 FullStackBench(68.3%)上的强劲表现凸显了该模型在多种编程范式和框架下的通用性,使其成为软件开发应用中的领先选择。

长上下文与智能体优势

扩展上下文处理
MiniMax-M1 在长上下文理解方面表现出色。在 OpenAI-MRCR (128k) 上达到 73.4%,远超其他开源模型,如 Qwen3-235B-A22B(27.7%)。百万 token 能力(56.2%)展示了在超长序列中保持一致性的独特能力。

智能体能力
在 TAU-bench 上的强劲表现(航空 62.0%,零售 63.5%)大幅领先 Qwen3-235B-A22B 的航空任务(34.7%),展示了跨领域应用中的竞争性智能体能力。

性能领先分析

minimax 基准测试

领先商业模型和开源模型在竞赛级数学、编程、软件工程、智能体工具使用和长上下文理解任务上的基准性能对比。MiniMax AI 在此图中使用 MiniMax-M1-80k 代表 MiniMax-M1。

开源领先
MiniMax-M1 在各个基准类别中持续优于开源竞争者,确立了在开源推理模型领域的领先地位。

上下文长度优势
百万 token 上下文带来巨大优势,在长上下文任务上与其他方案的性能差距超过 45 个百分点。

商业竞争力
虽然商业模型在某些类别中得分更高,但 MiniMax-M1 以开源可用性和部署灵活性优势提供了竞争性性能。

如何在 Novita AI 上使用 MiniMax-M1

在 Novita AI 上开始使用 MiniMax-M1 非常简单且无风险。新用户可获得 $10 免费额度——足以探索 MiniMax-M1 的混合注意力推理能力、构建原型并启动初始用例,无需前期成本。

使用 Playground(无需编码)

即时访问注册,领取免费额度,立即开始使用 Qwen 3 及其他顶级模型。

交互式界面:测试提示词、思维链推理,并实时可视化结果。

模型对比:轻松在 Qwen 3、Llama 4、DeepSeek 等模型之间切换,找到最适合您需求的模型。

通过 API 集成(面向开发者)

使用 Novita AI 的统一 REST API,将 MiniMax-M1 无缝集成到应用程序、工作流或聊天机器人中。无需管理模型权重或操心基础设施——Novita AI 提供多语言 SDK(Python、Node.js、cURL)和高级参数控制。

选项 1:直接 API 集成(Python 示例)

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_T3FM6wKgMO4YSk7lWfKo5H99EzvOqeJYVrxM6W1u2kuckMW0MuJhSAGDv9jNsFJ09pQ8r6mJHXJoldr_gxQ4WA==",
)

model = "minimaxai/minimax-m1-80k"
stream = True # or False
max_tokens = 20000
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
 

选项 2:使用 OpenAI Agents SDK 构建多智能体工作流

通过将 Novita AI 与 OpenAI Agents SDK 集成,构建高级多智能体系统:

  • 即插即用:在任何 OpenAI Agents 工作流中使用 Novita AI 的 MiniMax-M1
  • 支持移交、路由和工具使用:设计能够委派、分流或运行函数的智能体,全部由 MiniMax-M1 的混合注意力能力驱动
  • Python 集成:只需将 SDK 指向 Novita 的端点(https://api.novita.ai/v3/openai)并使用您的 API 密钥即可

在第三方平台上连接 MiniMax-M1 API

  • Hugging Face:通过 Novita AI 端点在 Spaces、pipeline 或 Transformers 库中使用 MiniMax-M1。

  • 智能体与编排框架:通过官方连接器和逐步集成指南,轻松将 Novita AI 与 ContinueAnythingLLMLangChainDifyLangflow 等合作伙伴平台连接。

  • 兼容 OpenAI 的 API:与 ClineCursor 等工具无缝迁移和集成,这些工具专为 OpenAI API 标准设计。

总结

MiniMax-M1 通过其混合注意力架构和跨领域的卓越表现,为开源推理模型树立了新标杆。

该模型拥有 100 万 token 上下文能力和 75% 的 FLOP 减少,非常适合需要高效与高级推理的复杂真实世界应用。

准备好体验 AI 推理的未来?立即在 Novita AI 上试用 MiniMax-M1领取您的 $10 免费额度

Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 部署 AI 模型的便捷方式,同时提供经济实惠且可靠的 GPU 云用于构建。