MiniMax-M1 現已於 Novita AI 上線 — 體驗混合注意力推理

什麼是 MiniMax-M1？
基準測試與效能分析
如何在 Novita AI 上存取 MiniMax-M1
結論

MiniMax-M1，全球首款開放權重的混合注意力推理模型，現已於 Novita AI 正式上線！這款突破性模型擁有 4560 億個參數——每個 Token 啟動 459 億個——並原生支援 100 萬 Token 的上下文，是 DeepSeek R1 的 8 倍。

限時優惠，新用戶可領取 $10 美元免費額度 來探索 MiniMax-M1 的先進推理能力。運用尖端的混合注意力技術為您的應用程式注入動力——MiniMax-M1 只需一個 API 呼叫即可使用。

以下是 MiniMax-M1 目前在 Novita AI 上的定價：

MiniMax-M1-80K：每百萬輸入 Token $0.55 美元，每百萬輸出 Token $2.2 美元

立即試用 MiniMax-M1-80K 示範

什麼是 MiniMax-M1？

MiniMax-M1 代表了大型語言模型架構的典範轉移。這款由 MiniMax-AI 開發的創新模型，引入了全球首款開放權重、大規模的混合注意力推理系統，結合了混合專家（MoE）架構與革命性的閃電注意力機制。

MiniMax-M1 的主要特色

🔹 混合注意力與混合專家

MoE 層為每個 Token 從 4560 億個參數中啟動 459 億個，並搭配閃電注意力以提升速度與效率。

🔹 龐大的 100 萬 Token 上下文

原生支援最高 100 萬 Token，非常適合總結書籍、日誌和完整程式碼庫。

🔹 高效的強化學習

CISPO 透過裁剪重要性加權樣本來提升強化學習訓練效率——這是 MoE 加上混合注意力架構的首創之舉。

🔹 雙重推理預算：40K 與 80K

根據所需的推理深度與計算取捨，選擇 MiniMax‑M1‑40K 或 MiniMax‑M1‑80K。

🔹 代理能力與外掛程式

內建函式呼叫、工具存取（搜尋、程式碼執行、圖片/影片生成、TTS），專為真實世界的代理工作流程最佳化。

基準測試與效能分析

MiniMax-M1 在全面的 AI 基準測試中展現了卓越的效能。標準評估顯示，該模型優於 DeepSeek-R1 和 Qwen3-235B 等強大的開放權重替代方案，特別是在軟體工程、工具使用和長上下文理解方面表現突出。

全面效能比較

類別	任務	MiniMax-M1-80K	MiniMax-M1-40K	Qwen3-235B-A22B	DeepSeek-R1-0528	DeepSeek-R1	Seed-Thinking-v1.5	Claude 4 Opus	Gemini 2.5 Pro	OpenAI-o3
延伸思考		80K	40K	32k	64k	32k	32k	64k	64k	100k
數學	AIME 2024	86.0	83.3	85.7	91.4	79.8	86.7	76.0	92.0	91.6
	AIME 2025	76.9	74.6	81.5	87.5	70.0	74.0	75.5	88.0	88.9
	MATH-500	96.8	96.0	96.2	98.0	97.3	96.7	98.2	98.8	98.1
一般程式設計	LiveCodeBench	65.0	62.3	65.9	73.1	55.9	67.5	56.6	77.1	75.8
	FullStackBench	68.3	67.6	62.9	69.4	70.1	69.9	70.3	--	69.3
推理與知識	GPQA Diamond	70.0	69.2	71.1	81.0	71.5	77.3	79.6	86.4	83.3
	ZebraLogic	86.8	80.1	80.3	95.1	78.7	84.4	95.1	91.6	95.8
	MMLU-Pro	81.1	80.6	83.0	85.0	84.0	87.0	85.0	86.0	85.0
軟體工程	SWE-bench Verified	56.0	55.6	34.4	57.6	49.2	47.0	72.5	67.2	69.1
長上下文	OpenAI-MRCR (128k)	73.4	76.1	27.7	51.5	35.8	54.3	48.9	76.8	56.5
	OpenAI-MRCR (1M)	56.2	58.6	--	--	--	--	--	58.8	--
	LongBench-v2	61.5	61.0	50.1	52.1	58.3	52.5	55.6	65.0	58.8
代理工具使用	TAU-bench (航空)	62.0	60.0	34.7	53.5	--	44.0	59.6	50.0	52.0
	TAU-bench (零售)	63.5	67.8	58.6	63.9	--	55.7	81.4	67.0	73.9

模型以 temperature=1.0, top_p=0.95 評估

數學與推理卓越表現

競賽級數學
MiniMax-M1-80K 在 AIME 2024（86.0）和 AIME 2025（76.9）上取得優異成績，在開放權重模型的數學推理中領先。該模型在 MATH-500 上 96.8% 的準確率，展現了處理複雜數學問題的精確能力。

進階推理任務
該模型在 ZebraLogic 中以 86.8% 的效能脫穎而出，大幅優於 Qwen3-235B（80.3%）和 DeepSeek-R1（78.7%）等開放權重替代方案。80K 和 40K 變體的表現一致（MMLU-Pro 分別為 81.1% 和 80.6%），展現了可靠的推理能力。

軟體工程與程式設計卓越表現

真實世界軟體開發
MiniMax-M1 在 SWE-bench Verified 上達到 56.0% 的驚人準確率，遠遠超越 Qwen3-235B-A22B（34.4%）。這項效能證明了該模型能夠理解複雜程式碼庫、識別問題並在真實場景中提出有效解決方案。

程式設計多功能性
在 LiveCodeBench（65.0%）和 FullStackBench（68.3%）上的強勁表現，凸顯了該模型跨程式設計範式與框架的多功能性，使其成為軟體開發應用的領先選擇。

長上下文與代理優勢

擴展上下文處理
MiniMax-M1 展現了卓越的長上下文理解能力。在 OpenAI-MRCR（128k）上達到 73.4%，遠優於包括 Qwen3-235B-A22B（27.7%）在內的其他開放權重模型。100 萬 Token 能力（56.2%）展示了在極長序列中維持連貫性的獨特優勢。

代理能力
在 TAU-bench 上的強勁表現（航空 62.0%，零售 63.5%）顯著優於 Qwen3-235B-A22B 在航空任務上的表現（34.7%），展示了在領域應用中具有競爭力的代理能力。

效能領導分析

領先商業與開放權重模型在競賽級數學、程式設計、軟體工程、代理工具使用與長上下文理解任務上的基準測試效能比較。MiniMax AI 在此處使用 MiniMax-M1-80k 模型代表 MiniMax-M1。

開放權重主導地位
MiniMax-M1 在基準測試類別中 consistently 優於開放權重競爭對手，在開放權重推理模型領域確立了明顯的領導地位。

上下文長度優勢
100 萬 Token 的上下文提供了顯著優勢，在長上下文任務上與其他替代方案相比有超過 45 個百分點的效能差距。

商業競爭力
雖然商業模型在某些類別中獲得較高分數，但 MiniMax-M1 以開放權重的可及性和部署靈活性優勢，提供了具競爭力的效能。

如何在 Novita AI 上存取 MiniMax-M1

在 Novita AI 上開始使用 MiniMax-M1 既簡單又無風險。新用戶可獲得 $10 美元免費額度——足以探索 MiniMax-M1 的混合注意力推理能力、建立原型並啟動初始使用案例，無需前期成本。

使用 Playground（無需撰寫程式碼）

即時存取：註冊，領取您的免費額度，並在幾秒鐘內開始體驗 Qwen 3 和其他頂級模型。

互動式 UI：測試提示詞、思路鏈推理，並即時視覺化結果。

模型比較：輕鬆在 Qwen 3、Llama 4、DeepSeek 等模型之間切換，找到最符合您需求的模型。

透過 API 整合（適用於開發者）

使用 Novita AI 統一的 REST API，將 MiniMax-M1 無縫連接到應用程式、工作流程或聊天機器人。無需管理模型權重或擔心基礎架構——Novita AI 提供多語言 SDK（Python、Node.js、cURL）和進階參數控制。

選項 1：直接 API 整合（Python 範例）

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="session_T3FM6wKgMO4YSk7lWfKo5H99EzvOqeJYVrxM6W1u2kuckMW0MuJhSAGDv9jNsFJ09pQ8r6mJHXJoldr_gxQ4WA==",
)

model = "minimaxai/minimax-m1-80k"
stream = True # or False
max_tokens = 20000
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

選項 2：使用 OpenAI Agents SDK 的多代理工作流程

透過將 Novita AI 與 OpenAI Agents SDK 整合，建置先進的多代理系統：

即插即用： 在任何 OpenAI Agents 工作流程中使用 Novita AI 的 MiniMax-M1
支援移交、路由與工具使用： 設計能夠委派、分流或執行程式的代理，全部由 MiniMax-M1 的混合注意力能力驅動
Python 整合： 只需將 SDK 指向 Novita 的端點（https://api.novita.ai/v3/openai）並使用您的 API 金鑰

在第三方平台上連接 MiniMax-M1 API

Hugging Face：透過 Novita AI 端點，在 Spaces、管道或 Transformers 函式庫中使用 Qwen 3。
代理與編排框架：
透過官方連接器和逐步整合指南，輕鬆將 Novita AI 與 Continue、AnythingLLM、LangChain、Dify 和 Langflow 等合作夥伴平台連接。
相容 OpenAI 的 API： 享受與 Cline 和 Cursor 等工具的無痛遷移與整合，這些工具專為 OpenAI API 標準設計。

結論

MiniMax-M1 透過其混合注意力架構以及在多元領域的卓越效能，為開放權重推理模型樹立了新的標竿。

該模型 100 萬 Token 的上下文能力以及 75% 的 FLOP 縮減，使其成為需要效率與先進推理能力的複雜真實世界應用的理想選擇。

準備好體驗 AI 推理的未來了嗎？立即在 Novita AI 上試用 MiniMax-M1 並 ** 領取您的 $10 美元免費額度**。

Novita AI 是一個 AI 雲端平台，為開發人員提供透過簡單 API 部署 AI 模型的簡便方式，同時提供經濟實惠且可靠的 GPU 雲端服務來建置與擴展應用程式。

MiniMax-M1 現已於 Novita AI 上線 — 體驗混合注意力推理