MiniMax-M1,全球首款開放權重的混合注意力推理模型,現已於 Novita AI 正式上線!這款突破性模型擁有 4560 億個參數——每個 Token 啟動 459 億個——並原生支援 100 萬 Token 的上下文,是 DeepSeek R1 的 8 倍。
限時優惠,新用戶可領取 $10 美元免費額度 來探索 MiniMax-M1 的先進推理能力。運用尖端的混合注意力技術為您的應用程式注入動力——MiniMax-M1 只需一個 API 呼叫即可使用。
以下是 MiniMax-M1 目前在 Novita AI 上的定價:
MiniMax-M1-80K:每百萬輸入 Token $0.55 美元,每百萬輸出 Token $2.2 美元
什麼是 MiniMax-M1?
MiniMax-M1 代表了大型語言模型架構的典範轉移。這款由 MiniMax-AI 開發的創新模型,引入了全球首款開放權重、大規模的混合注意力推理系統,結合了混合專家(MoE)架構與革命性的閃電注意力機制。
MiniMax-M1 的主要特色
🔹 混合注意力與混合專家
MoE 層為每個 Token 從 4560 億個參數中啟動 459 億個,並搭配閃電注意力以提升速度與效率。
🔹 龐大的 100 萬 Token 上下文
原生支援最高 100 萬 Token,非常適合總結書籍、日誌和完整程式碼庫。
🔹 高效的強化學習
CISPO 透過裁剪重要性加權樣本來提升強化學習訓練效率——這是 MoE 加上混合注意力架構的首創之舉。
🔹 雙重推理預算:40K 與 80K
根據所需的推理深度與計算取捨,選擇 MiniMax‑M1‑40K 或 MiniMax‑M1‑80K。
🔹 代理能力與外掛程式
內建函式呼叫、工具存取(搜尋、程式碼執行、圖片/影片生成、TTS),專為真實世界的代理工作流程最佳化。
基準測試與效能分析
MiniMax-M1 在全面的 AI 基準測試中展現了卓越的效能。標準評估顯示,該模型優於 DeepSeek-R1 和 Qwen3-235B 等強大的開放權重替代方案,特別是在軟體工程、工具使用和長上下文理解方面表現突出。
全面效能比較
| 類別 | 任務 | MiniMax-M1-80K | MiniMax-M1-40K | Qwen3-235B-A22B | DeepSeek-R1-0528 | DeepSeek-R1 | Seed-Thinking-v1.5 | Claude 4 Opus | Gemini 2.5 Pro | OpenAI-o3 |
|---|---|---|---|---|---|---|---|---|---|---|
| **延伸思考 ** | 80K | 40K | 32k | 64k | 32k | 32k | 64k | 64k | 100k | |
| **數學 ** | AIME 2024 | 86.0 | 83.3 | 85.7 | 91.4 | 79.8 | 86.7 | 76.0 | 92.0 | 91.6 |
| AIME 2025 | 76.9 | 74.6 | 81.5 | 87.5 | 70.0 | 74.0 | 75.5 | 88.0 | 88.9 | |
| MATH-500 | 96.8 | 96.0 | 96.2 | 98.0 | 97.3 | 96.7 | 98.2 | 98.8 | 98.1 | |
| **一般程式設計 ** | LiveCodeBench | 65.0 | 62.3 | 65.9 | 73.1 | 55.9 | 67.5 | 56.6 | 77.1 | 75.8 |
| FullStackBench | 68.3 | 67.6 | 62.9 | 69.4 | 70.1 | 69.9 | 70.3 | -- | 69.3 | |
| **推理與知識 ** | GPQA Diamond | 70.0 | 69.2 | 71.1 | 81.0 | 71.5 | 77.3 | 79.6 | 86.4 | 83.3 |
| ZebraLogic | 86.8 | 80.1 | 80.3 | 95.1 | 78.7 | 84.4 | 95.1 | 91.6 | 95.8 | |
| MMLU-Pro | 81.1 | 80.6 | 83.0 | 85.0 | 84.0 | 87.0 | 85.0 | 86.0 | 85.0 | |
| **軟體工程 ** | SWE-bench Verified | 56.0 | 55.6 | 34.4 | 57.6 | 49.2 | 47.0 | 72.5 | 67.2 | 69.1 |
| **長上下文 ** | OpenAI-MRCR (128k) | 73.4 | 76.1 | 27.7 | 51.5 | 35.8 | 54.3 | 48.9 | 76.8 | 56.5 |
| OpenAI-MRCR (1M) | 56.2 | 58.6 | -- | -- | -- | -- | -- | 58.8 | -- | |
| LongBench-v2 | 61.5 | 61.0 | 50.1 | 52.1 | 58.3 | 52.5 | 55.6 | 65.0 | 58.8 | |
| **代理工具使用 ** | TAU-bench (航空) | 62.0 | 60.0 | 34.7 | 53.5 | -- | 44.0 | 59.6 | 50.0 | 52.0 |
| TAU-bench (零售) | 63.5 | 67.8 | 58.6 | 63.9 | -- | 55.7 | 81.4 | 67.0 | 73.9 |
模型以 temperature=1.0, top_p=0.95 評估
數學與推理卓越表現
競賽級數學
MiniMax-M1-80K 在 AIME 2024(86.0)和 AIME 2025(76.9)上取得優異成績,在開放權重模型的數學推理中領先。該模型在 MATH-500 上 96.8% 的準確率,展現了處理複雜數學問題的精確能力。
進階推理任務
該模型在 ZebraLogic 中以 86.8% 的效能脫穎而出,大幅優於 Qwen3-235B(80.3%)和 DeepSeek-R1(78.7%)等開放權重替代方案。80K 和 40K 變體的表現一致(MMLU-Pro 分別為 81.1% 和 80.6%),展現了可靠的推理能力。
軟體工程與程式設計卓越表現
真實世界軟體開發
MiniMax-M1 在 SWE-bench Verified 上達到 56.0% 的驚人準確率,遠遠超越 Qwen3-235B-A22B(34.4%)。這項效能證明了該模型能夠理解複雜程式碼庫、識別問題並在真實場景中提出有效解決方案。
程式設計多功能性
在 LiveCodeBench(65.0%)和 FullStackBench(68.3%)上的強勁表現,凸顯了該模型跨程式設計範式與框架的多功能性,使其成為軟體開發應用的領先選擇。
長上下文與代理優勢
擴展上下文處理
MiniMax-M1 展現了卓越的長上下文理解能力。在 OpenAI-MRCR(128k)上達到 73.4%,遠優於包括 Qwen3-235B-A22B(27.7%)在內的其他開放權重模型。100 萬 Token 能力(56.2%)展示了在極長序列中維持連貫性的獨特優勢。
代理能力
在 TAU-bench 上的強勁表現(航空 62.0%,零售 63.5%)顯著優於 Qwen3-235B-A22B 在航空任務上的表現(34.7%),展示了在領域應用中具有競爭力的代理能力。
效能領導分析

領先商業與開放權重模型在競賽級數學、程式設計、軟體工程、代理工具使用與長上下文理解任務上的基準測試效能比較。MiniMax AI 在此處使用 MiniMax-M1-80k 模型代表 MiniMax-M1。
開放權重主導地位
MiniMax-M1 在基準測試類別中 consistently 優於開放權重競爭對手,在開放權重推理模型領域確立了明顯的領導地位。
上下文長度優勢
100 萬 Token 的上下文提供了顯著優勢,在長上下文任務上與其他替代方案相比有超過 45 個百分點的效能差距。
商業競爭力
雖然商業模型在某些類別中獲得較高分數,但 MiniMax-M1 以開放權重的可及性和部署靈活性優勢,提供了具競爭力的效能。
如何在 Novita AI 上存取 MiniMax-M1
在 Novita AI 上開始使用 MiniMax-M1 既簡單又無風險。新用戶可獲得 $10 美元免費額度——足以探索 MiniMax-M1 的混合注意力推理能力、建立原型並啟動初始使用案例,無需前期成本。
使用 Playground(無需撰寫程式碼)
即時存取:註冊,領取您的免費額度,並在幾秒鐘內開始體驗 Qwen 3 和其他頂級模型。
互動式 UI:測試提示詞、思路鏈推理,並即時視覺化結果。
模型比較:輕鬆在 Qwen 3、Llama 4、DeepSeek 等模型之間切換,找到最符合您需求的模型。
透過 API 整合(適用於開發者)
使用 Novita AI 統一的 REST API,將 MiniMax-M1 無縫連接到應用程式、工作流程或聊天機器人。無需管理模型權重或擔心基礎架構——Novita AI 提供多語言 SDK(Python、Node.js、cURL)和進階參數控制。
選項 1:直接 API 整合(Python 範例)
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="session_T3FM6wKgMO4YSk7lWfKo5H99EzvOqeJYVrxM6W1u2kuckMW0MuJhSAGDv9jNsFJ09pQ8r6mJHXJoldr_gxQ4WA==",
)
model = "minimaxai/minimax-m1-80k"
stream = True # or False
max_tokens = 20000
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
選項 2:使用 OpenAI Agents SDK 的多代理工作流程
透過將 Novita AI 與 OpenAI Agents SDK 整合,建置先進的多代理系統:
- 即插即用: 在任何 OpenAI Agents 工作流程中使用 Novita AI 的 MiniMax-M1
- 支援移交、路由與工具使用: 設計能夠委派、分流或執行程式的代理,全部由 MiniMax-M1 的混合注意力能力驅動
- Python 整合: 只需將 SDK 指向 Novita 的端點(
https://api.novita.ai/v3/openai)並使用您的 API 金鑰
在第三方平台上連接 MiniMax-M1 API
-
Hugging Face:透過 Novita AI 端點,在 Spaces、管道或 Transformers 函式庫中使用 Qwen 3。
-
代理與編排框架:
透過官方連接器和逐步整合指南,輕鬆將 Novita AI 與 Continue、AnythingLLM、LangChain、Dify 和 Langflow 等合作夥伴平台連接。 -
相容 OpenAI 的 API: 享受與 Cline 和 Cursor 等工具的無痛遷移與整合,這些工具專為 OpenAI API 標準設計。
結論
MiniMax-M1 透過其混合注意力架構以及在多元領域的卓越效能,為開放權重推理模型樹立了新的標竿。
該模型 100 萬 Token 的上下文能力以及 75% 的 FLOP 縮減,使其成為需要效率與先進推理能力的複雜真實世界應用的理想選擇。
準備好體驗 AI 推理的未來了嗎?立即在 Novita AI 上試用 MiniMax-M1 並 ** 領取您的 $10 美元免費額度**。
Novita AI 是一個 AI 雲端平台,為開發人員提供透過簡單 API 部署 AI 模型的簡便方式,同時提供經濟實惠且可靠的 GPU 雲端服務來建置與擴展應用程式。
