MiniMax-M1 现已登陆 Novita AI —— 体验混合注意力推理

MiniMax-M1 是什么？
基准测试与性能分析
如何在 Novita AI 上使用 MiniMax-M1
总结

MiniMax-M1，全球首个开源混合注意力推理模型，现已登陆 Novita AI！这款突破性模型拥有 4560 亿参数 —— 每个 token 激活 459 亿参数 —— 并原生支持 100 万 token 上下文，是 DeepSeek R1 的 8 倍。

限时优惠，新用户可领取 $10 免费额度，立即探索 MiniMax-M1 的强大推理能力。借助先进的混合注意力技术赋能您的应用 —— 只需一个 API 调用即可使用 MiniMax-M1。

以下是 MiniMax-M1 在 Novita AI 上的当前定价：

MiniMax-M1-80K：每 100 万输入 token 为 $0.55，每 100 万输出 token 为 $2.2

立即试用 MiniMax-M1-80K 演示

MiniMax-M1 是什么？

MiniMax-M1 代表了大型语言模型架构的范式转变。这款由 MiniMax-AI 开发的创新模型，首次将混合 Mixture-of-Experts（MoE）架构与革命性的闪电注意力机制相结合，打造出世界上首个开源的大规模混合注意力推理系统。

MiniMax-M1 的主要特性

🔹 混合注意力与混合专家

MoE 层对每个 token 从 4560 亿参数中激活 459 亿参数，配合闪电注意力实现速度和效率的双重提升。

🔹 百万级 Token 上下文

原生支持高达 100 万个 token，非常适合总结书籍、日志和整个代码库。

🔹 高效强化学习

CISPO 通过裁剪重要性采样权重来提升 RL 训练效率 —— 这是 MoE + 混合注意力架构中的首创。

🔹 双重思考预算：40K 与 80K

根据所需的推理深度和计算权衡，选择 MiniMax‑M1‑40K 或 MiniMax‑M1‑80K。

🔹 智能体能力与插件

内置函数调用、工具访问（搜索、代码执行、图像/视频生成、TTS），为真实世界的智能体工作流进行了优化。

基准测试与性能分析

MiniMax-M1 在全面的 AI 基准测试中表现出色。标准评估表明，该模型优于 DeepSeek-R1 和 Qwen3-235B 等强大的开源替代方案，尤其在软件工程、工具使用和长上下文理解方面表现突出。

综合性能对比

类别	任务	MiniMax-M1-80K	MiniMax-M1-40K	Qwen3-235B-A22B	DeepSeek-R1-0528	DeepSeek-R1	Seed-Thinking-v1.5	Claude 4 Opus	Gemini 2.5 Pro	OpenAI-o3
扩展思考		80K	40K	32k	64k	32k	32k	64k	64k	100k
数学	AIME 2024	86.0	83.3	85.7	91.4	79.8	86.7	76.0	92.0	91.6
	AIME 2025	76.9	74.6	81.5	87.5	70.0	74.0	75.5	88.0	88.9
	MATH-500	96.8	96.0	96.2	98.0	97.3	96.7	98.2	98.8	98.1
通用编程	LiveCodeBench	65.0	62.3	65.9	73.1	55.9	67.5	56.6	77.1	75.8
	FullStackBench	68.3	67.6	62.9	69.4	70.1	69.9	70.3	--	69.3
推理与知识	GPQA Diamond	70.0	69.2	71.1	81.0	71.5	77.3	79.6	86.4	83.3
	ZebraLogic	86.8	80.1	80.3	95.1	78.7	84.4	95.1	91.6	95.8
	MMLU-Pro	81.1	80.6	83.0	85.0	84.0	87.0	85.0	86.0	85.0
软件工程	SWE-bench Verified	56.0	55.6	34.4	57.6	49.2	47.0	72.5	67.2	69.1
长上下文	OpenAI-MRCR (128k)	73.4	76.1	27.7	51.5	35.8	54.3	48.9	76.8	56.5
	OpenAI-MRCR (1M)	56.2	58.6	--	--	--	--	--	58.8	--
	LongBench-v2	61.5	61.0	50.1	52.1	58.3	52.5	55.6	65.0	58.8
智能体工具使用	TAU-bench (航空)	62.0	60.0	34.7	53.5	--	44.0	59.6	50.0	52.0
	TAU-bench (零售)	63.5	67.8	58.6	63.9	--	55.7	81.4	67.0	73.9

模型评估参数：temperature=1.0, top_p=0.95

数学与推理卓越性

竞赛级数学
MiniMax-M1-80K 在 AIME 2024（86.0）和 AIME 2025（76.9）上取得出色成绩，在开源推理模型中数学推理领先。该模型在 MATH-500 上达到 96.8% 的准确率，展现了处理复杂数学问题的卓越能力。

高级推理任务
该模型在 ZebraLogic 上以 86.8% 的性能大幅超越 Qwen3-235B（80.3%）和 DeepSeek-R1（78.7%）等开源替代方案。80K 和 40K 两个版本在 MMLU-Pro 上的一致表现（81.1% 和 80.6%）展示了可靠的推理能力。

软件工程与编程卓越性

真实世界软件开发
MiniMax-M1 在 SWE-bench Verified 上取得 56.0% 的显著成绩，大幅领先 Qwen3-235B-A22B（34.4%）。这一表现证明了该模型理解复杂代码库、识别问题并提出有效解决方案的能力。

编程多样性
在 LiveCodeBench（65.0%）和 FullStackBench（68.3%）上的强劲表现凸显了该模型在多种编程范式和框架下的通用性，使其成为软件开发应用中的领先选择。

长上下文与智能体优势

扩展上下文处理
MiniMax-M1 在长上下文理解方面表现出色。在 OpenAI-MRCR (128k) 上达到 73.4%，远超其他开源模型，如 Qwen3-235B-A22B（27.7%）。百万 token 能力（56.2%）展示了在超长序列中保持一致性的独特能力。

智能体能力
在 TAU-bench 上的强劲表现（航空 62.0%，零售 63.5%）大幅领先 Qwen3-235B-A22B 的航空任务（34.7%），展示了跨领域应用中的竞争性智能体能力。

性能领先分析

领先商业模型和开源模型在竞赛级数学、编程、软件工程、智能体工具使用和长上下文理解任务上的基准性能对比。MiniMax AI 在此图中使用 MiniMax-M1-80k 代表 MiniMax-M1。

开源领先
MiniMax-M1 在各个基准类别中持续优于开源竞争者，确立了在开源推理模型领域的领先地位。

上下文长度优势
百万 token 上下文带来巨大优势，在长上下文任务上与其他方案的性能差距超过 45 个百分点。

商业竞争力
虽然商业模型在某些类别中得分更高，但 MiniMax-M1 以开源可用性和部署灵活性优势提供了竞争性性能。

如何在 Novita AI 上使用 MiniMax-M1

在 Novita AI 上开始使用 MiniMax-M1 非常简单且无风险。新用户可获得 $10 免费额度——足以探索 MiniMax-M1 的混合注意力推理能力、构建原型并启动初始用例，无需前期成本。

使用 Playground（无需编码）

即时访问：注册，领取免费额度，立即开始使用 Qwen 3 及其他顶级模型。

交互式界面：测试提示词、思维链推理，并实时可视化结果。

模型对比：轻松在 Qwen 3、Llama 4、DeepSeek 等模型之间切换，找到最适合您需求的模型。

通过 API 集成（面向开发者）

使用 Novita AI 的统一 REST API，将 MiniMax-M1 无缝集成到应用程序、工作流或聊天机器人中。无需管理模型权重或操心基础设施——Novita AI 提供多语言 SDK（Python、Node.js、cURL）和高级参数控制。

选项 1：直接 API 集成（Python 示例）

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_T3FM6wKgMO4YSk7lWfKo5H99EzvOqeJYVrxM6W1u2kuckMW0MuJhSAGDv9jNsFJ09pQ8r6mJHXJoldr_gxQ4WA==",
)

model = "minimaxai/minimax-m1-80k"
stream = True # or False
max_tokens = 20000
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

选项 2：使用 OpenAI Agents SDK 构建多智能体工作流

通过将 Novita AI 与 OpenAI Agents SDK 集成，构建高级多智能体系统：

即插即用：在任何 OpenAI Agents 工作流中使用 Novita AI 的 MiniMax-M1
支持移交、路由和工具使用：设计能够委派、分流或运行函数的智能体，全部由 MiniMax-M1 的混合注意力能力驱动
Python 集成：只需将 SDK 指向 Novita 的端点（https://api.novita.ai/v3/openai）并使用您的 API 密钥即可

在第三方平台上连接 MiniMax-M1 API

Hugging Face：通过 Novita AI 端点在 Spaces、pipeline 或 Transformers 库中使用 MiniMax-M1。
智能体与编排框架：通过官方连接器和逐步集成指南，轻松将 Novita AI 与 Continue、AnythingLLM、LangChain、Dify 和 Langflow 等合作伙伴平台连接。
兼容 OpenAI 的 API：与 Cline 和 Cursor 等工具无缝迁移和集成，这些工具专为 OpenAI API 标准设计。

总结

MiniMax-M1 通过其混合注意力架构和跨领域的卓越表现，为开源推理模型树立了新标杆。

该模型拥有 100 万 token 上下文能力和 75% 的 FLOP 减少，非常适合需要高效与高级推理的复杂真实世界应用。

准备好体验 AI 推理的未来？立即在 Novita AI 上试用 MiniMax-M1 并领取您的 $10 免费额度。

Novita AI 是一个 AI 云平台，为开发者提供通过简单 API 部署 AI 模型的便捷方式，同时提供经济实惠且可靠的 GPU 云用于构建。

MiniMax-M1 现已登陆 Novita AI —— 体验混合注意力推理