MiniMax-M1 現已於 Novita AI 上線 — 體驗混合注意力推理

MiniMax-M1 現已於 Novita AI 上線 — 體驗混合注意力推理

MiniMax-M1,全球首款開放權重的混合注意力推理模型,現已於 Novita AI 正式上線!這款突破性模型擁有 4560 億個參數——每個 Token 啟動 459 億個——並原生支援 100 萬 Token 的上下文,是 DeepSeek R1 的 8 倍。

限時優惠,新用戶可領取 $10 美元免費額度 來探索 MiniMax-M1 的先進推理能力。運用尖端的混合注意力技術為您的應用程式注入動力——MiniMax-M1 只需一個 API 呼叫即可使用。

以下是 MiniMax-M1 目前在 Novita AI 上的定價:

MiniMax-M1-80K:每百萬輸入 Token $0.55 美元,每百萬輸出 Token $2.2 美元

立即試用 MiniMax-M1-80K 示範

什麼是 MiniMax-M1?

MiniMax-M1 代表了大型語言模型架構的典範轉移。這款由 MiniMax-AI 開發的創新模型,引入了全球首款開放權重、大規模的混合注意力推理系統,結合了混合專家(MoE)架構與革命性的閃電注意力機制。

MiniMax-M1 的主要特色

🔹 混合注意力與混合專家

MoE 層為每個 Token 從 4560 億個參數中啟動 459 億個,並搭配閃電注意力以提升速度與效率。

🔹 龐大的 100 萬 Token 上下文

原生支援最高 100 萬 Token,非常適合總結書籍、日誌和完整程式碼庫。

🔹 高效的強化學習

CISPO 透過裁剪重要性加權樣本來提升強化學習訓練效率——這是 MoE 加上混合注意力架構的首創之舉。

🔹 雙重推理預算:40K 與 80K

根據所需的推理深度與計算取捨,選擇 MiniMax‑M1‑40K 或 MiniMax‑M1‑80K。

🔹 代理能力與外掛程式

內建函式呼叫、工具存取(搜尋、程式碼執行、圖片/影片生成、TTS),專為真實世界的代理工作流程最佳化。

基準測試與效能分析

MiniMax-M1 在全面的 AI 基準測試中展現了卓越的效能。標準評估顯示,該模型優於 DeepSeek-R1 和 Qwen3-235B 等強大的開放權重替代方案,特別是在軟體工程、工具使用和長上下文理解方面表現突出。

全面效能比較

類別 任務 MiniMax-M1-80K MiniMax-M1-40K Qwen3-235B-A22B DeepSeek-R1-0528 DeepSeek-R1 Seed-Thinking-v1.5 Claude 4 Opus Gemini 2.5 Pro OpenAI-o3
**延伸思考 ** 80K 40K 32k 64k 32k 32k 64k 64k 100k
**數學 ** AIME 2024 86.0 83.3 85.7 91.4 79.8 86.7 76.0 92.0 91.6
AIME 2025 76.9 74.6 81.5 87.5 70.0 74.0 75.5 88.0 88.9
MATH-500 96.8 96.0 96.2 98.0 97.3 96.7 98.2 98.8 98.1
**一般程式設計 ** LiveCodeBench 65.0 62.3 65.9 73.1 55.9 67.5 56.6 77.1 75.8
FullStackBench 68.3 67.6 62.9 69.4 70.1 69.9 70.3 -- 69.3
**推理與知識 ** GPQA Diamond 70.0 69.2 71.1 81.0 71.5 77.3 79.6 86.4 83.3
ZebraLogic 86.8 80.1 80.3 95.1 78.7 84.4 95.1 91.6 95.8
MMLU-Pro 81.1 80.6 83.0 85.0 84.0 87.0 85.0 86.0 85.0
**軟體工程 ** SWE-bench Verified 56.0 55.6 34.4 57.6 49.2 47.0 72.5 67.2 69.1
**長上下文 ** OpenAI-MRCR (128k) 73.4 76.1 27.7 51.5 35.8 54.3 48.9 76.8 56.5
OpenAI-MRCR (1M) 56.2 58.6 -- -- -- -- -- 58.8 --
LongBench-v2 61.5 61.0 50.1 52.1 58.3 52.5 55.6 65.0 58.8
**代理工具使用 ** TAU-bench (航空) 62.0 60.0 34.7 53.5 -- 44.0 59.6 50.0 52.0
TAU-bench (零售) 63.5 67.8 58.6 63.9 -- 55.7 81.4 67.0 73.9

模型以 temperature=1.0, top_p=0.95 評估

數學與推理卓越表現

競賽級數學
MiniMax-M1-80K 在 AIME 2024(86.0)和 AIME 2025(76.9)上取得優異成績,在開放權重模型的數學推理中領先。該模型在 MATH-500 上 96.8% 的準確率,展現了處理複雜數學問題的精確能力。

進階推理任務
該模型在 ZebraLogic 中以 86.8% 的效能脫穎而出,大幅優於 Qwen3-235B(80.3%)和 DeepSeek-R1(78.7%)等開放權重替代方案。80K 和 40K 變體的表現一致(MMLU-Pro 分別為 81.1% 和 80.6%),展現了可靠的推理能力。

軟體工程與程式設計卓越表現

真實世界軟體開發
MiniMax-M1 在 SWE-bench Verified 上達到 56.0% 的驚人準確率,遠遠超越 Qwen3-235B-A22B(34.4%)。這項效能證明了該模型能夠理解複雜程式碼庫、識別問題並在真實場景中提出有效解決方案。

程式設計多功能性
在 LiveCodeBench(65.0%)和 FullStackBench(68.3%)上的強勁表現,凸顯了該模型跨程式設計範式與框架的多功能性,使其成為軟體開發應用的領先選擇。

長上下文與代理優勢

擴展上下文處理
MiniMax-M1 展現了卓越的長上下文理解能力。在 OpenAI-MRCR(128k)上達到 73.4%,遠優於包括 Qwen3-235B-A22B(27.7%)在內的其他開放權重模型。100 萬 Token 能力(56.2%)展示了在極長序列中維持連貫性的獨特優勢。

代理能力
在 TAU-bench 上的強勁表現(航空 62.0%,零售 63.5%)顯著優於 Qwen3-235B-A22B 在航空任務上的表現(34.7%),展示了在領域應用中具有競爭力的代理能力。

效能領導分析

minimax 基準測試

領先商業與開放權重模型在競賽級數學、程式設計、軟體工程、代理工具使用與長上下文理解任務上的基準測試效能比較。MiniMax AI 在此處使用 MiniMax-M1-80k 模型代表 MiniMax-M1。

開放權重主導地位
MiniMax-M1 在基準測試類別中 consistently 優於開放權重競爭對手,在開放權重推理模型領域確立了明顯的領導地位。

上下文長度優勢
100 萬 Token 的上下文提供了顯著優勢,在長上下文任務上與其他替代方案相比有超過 45 個百分點的效能差距。

商業競爭力
雖然商業模型在某些類別中獲得較高分數,但 MiniMax-M1 以開放權重的可及性和部署靈活性優勢,提供了具競爭力的效能。

如何在 Novita AI 上存取 MiniMax-M1

在 Novita AI 上開始使用 MiniMax-M1 既簡單又無風險。新用戶可獲得 $10 美元免費額度——足以探索 MiniMax-M1 的混合注意力推理能力、建立原型並啟動初始使用案例,無需前期成本。

使用 Playground(無需撰寫程式碼)

即時存取註冊,領取您的免費額度,並在幾秒鐘內開始體驗 Qwen 3 和其他頂級模型。

互動式 UI:測試提示詞、思路鏈推理,並即時視覺化結果。

模型比較:輕鬆在 Qwen 3、Llama 4、DeepSeek 等模型之間切換,找到最符合您需求的模型。

透過 API 整合(適用於開發者)

使用 Novita AI 統一的 REST API,將 MiniMax-M1 無縫連接到應用程式、工作流程或聊天機器人。無需管理模型權重或擔心基礎架構——Novita AI 提供多語言 SDK(Python、Node.js、cURL)和進階參數控制。

選項 1:直接 API 整合(Python 範例)

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_T3FM6wKgMO4YSk7lWfKo5H99EzvOqeJYVrxM6W1u2kuckMW0MuJhSAGDv9jNsFJ09pQ8r6mJHXJoldr_gxQ4WA==",
)

model = "minimaxai/minimax-m1-80k"
stream = True # or False
max_tokens = 20000
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
 

選項 2:使用 OpenAI Agents SDK 的多代理工作流程

透過將 Novita AI 與 OpenAI Agents SDK 整合,建置先進的多代理系統:

  • 即插即用: 在任何 OpenAI Agents 工作流程中使用 Novita AI 的 MiniMax-M1
  • 支援移交、路由與工具使用: 設計能夠委派、分流或執行程式的代理,全部由 MiniMax-M1 的混合注意力能力驅動
  • Python 整合: 只需將 SDK 指向 Novita 的端點(https://api.novita.ai/v3/openai)並使用您的 API 金鑰

在第三方平台上連接 MiniMax-M1 API

  • Hugging Face:透過 Novita AI 端點,在 Spaces、管道或 Transformers 函式庫中使用 Qwen 3。

  • 代理與編排框架:
    透過官方連接器和逐步整合指南,輕鬆將 Novita AI 與 ContinueAnythingLLMLangChainDifyLangflow 等合作夥伴平台連接。

  • 相容 OpenAI 的 API: 享受與 ClineCursor 等工具的無痛遷移與整合,這些工具專為 OpenAI API 標準設計。

結論

MiniMax-M1 透過其混合注意力架構以及在多元領域的卓越效能,為開放權重推理模型樹立了新的標竿。

該模型 100 萬 Token 的上下文能力以及 75% 的 FLOP 縮減,使其成為需要效率與先進推理能力的複雜真實世界應用的理想選擇。

準備好體驗 AI 推理的未來了嗎?立即在 Novita AI 上試用 MiniMax-M1** 領取您的 $10 美元免費額度**

Novita AI 是一個 AI 雲端平台,為開發人員提供透過簡單 API 部署 AI 模型的簡便方式,同時提供經濟實惠且可靠的 GPU 雲端服務來建置與擴展應用程式。