MiniMax M2.5 是市面上最快、最具成本效益的 AI 程式碼開發代理之一。透過 Novita AI,你只需每 100 萬個 Token 支付 $0.30/$1.20 即可使用。M2.5 在 SWE-Bench Verified 上達到 80.2%,在 Multi-SWE-Bench 上達到 51.3%,提供頂尖的程式碼開發效能,同時任務完成速度比 M2.1 快 37%——以極低的成本達到與 Claude Opus 4.6 相當的速度。
本指南將精準示範如何透過 Novita AI 的 OpenAI 相容 API 存取 MiniMax M2.5、將其部署至正式環境工作負載,並充分發揮其在代理式程式開發、工具使用及辦公室自動化方面的獨特優勢。
MiniMax M2.5 是什麼?
MiniMax M2.5 是一款 2287 億參數的混合專家(MoE)模型,專為真實世界的生產力任務而訓練。它擁有 256 個專家,每次 Token 啟動 8 個專家,在程式開發、代理式工具使用、網頁搜尋及辦公室自動化方面均能提供前沿效能,同時維持極高的推論效率。
MiniMax M2.5 的架構
| 規格 | MiniMax M2.5 |
|---|---|
| 總參數 | 229B |
| 架構 | 混合專家(MoE) |
| 專家數量 | 256 個總數,每次 Token 啟動 8 個 |
| 語境長度 | 196,608 個 Token(約 196K) |
| 隱藏層大小 | 3072 |
| 層數 | 62 |
| 詞彙量 | 200,064 |
MiniMax M2.5 的基準測試
MiniMax M2.5 在程式開發、代理任務及辦公室自動化基準測試中均達到頂尖成果——效能堪比定價高出 3 到 5 倍的模型,成本卻低得多。該模型在超過 20 萬個真實環境中透過強化學習進行訓練,因此在實際任務中具備無與倫比的泛化能力。
程式開發與代理及工具使用

來自 HuggingFace

來自 HuggingFace
MiniMax M2.5 並非在所有基準測試中都佔據主導地位,但在模擬、檢索及多輪推理任務上始終保持強勁表現。其效能輪廓顯示:
- 強大的代理式任務協調能力
- 穩健的檢索與搜尋整合
- 穩定的多輪推理
- 具競爭力的結構化環境模擬
總體而言,MiniMax M2.5 似乎專為實際的代理工作流程及複雜的多步驟執行而最佳化,而非純學術性的推理基準。
辦公室自動化
MiniMax M2.5 並非設計用來主導抽象學術推理基準或純數學競賽。其優勢在於專業的辦公室執行任務,尤其是需要結構化、可交付成果的任務。
| 基準測試 | MiniMax M2.5 | MiniMax M2.1 | Claude Opus 4.5 | Claude Opus 4.6 | Gemini 3 Pro | GPT-5.2 |
|---|---|---|---|---|---|---|
| GDPval-MM | 59.0 | 24.6 | 61.1 | 73.5 | 28.1 | 54.5 |
| MEWC | 74.4 | 55.6 | 82.1 | 89.8 | 78.7 | 41.3 |
| 財務建模 | 21.6 | 17.3 | 30.1 | 33.2 | 15.0 | 20.0 |
MiniMax M2.5 的速度
為什麼 M2.5 的速度很重要: 完成 SWE-Bench 的速度比 M2.1 快 37%,這意味著更低的 API 成本以及更快的迭代週期。對於典型的跨檔案重構任務,M2.5 只需 45 秒即可完成,而 M2.1 則需要 70 秒——在大規模使用時,既能節省時間也能節省成本。
為什麼選擇 Novita AI 上的 MiniMax M2.5?
Novita AI 在生產環境中執行 MiniMax M2.5 提供了最佳的性價比。雖然自行託管需要 4 到 8 張 H100 GPU(最低每小時 $5.80),但 Novita 的無伺服器 API 僅需每 100 萬個輸入 Token $0.30、每 100 萬個輸出 Token $1.20——且無需基礎設施開銷、可即時擴展,並提供 99.5% 正常運行時間 SLA。
Novita AI 在 MiniMax M2.5 上的主要優勢:
| 功能 | Novita AI | 自行託管 |
|---|---|---|
| 設定時間 | 2 分鐘(API 金鑰) | 2 到 5 天(GPU 佈建 + 設定) |
| 成本模型 | 按 Token 計費(每 100 萬個 $0.30/$1.20) | 固定 GPU 租用(4 張 H100 每小時 $5.80+) |
| 擴展 | 即時自動擴展 | 手動 GPU 佈建 |
| 維護 | 無需維護(託管服務) | 維護工作量大(vLLM、驅動程式、更新) |
| 可用性 | 99.5% SLA | 取決於你的基礎設施 |
| 最適合 | 變動工作負載、快速原型開發、生產 API | 全天候高用量推論且負載可預測 |
如何在 Novita AI 上存取 MiniMax M2.5
步驟 1:登入並存取模型庫
登入你的帳號,然後點擊 模型庫 按鈕。

步驟 2:選擇你的模型
瀏覽可用的選項,然後選擇符合你需求的模型。

步驟 3:開始免費試用
開始免費試用,探索所選模型的功能。

步驟 4:取得你的 API 金鑰
為了驗證 API,我們將為你提供一個新的 API 金鑰。進入「設定」頁面後,你可以依照圖片指示複製 API 金鑰。

步驟 5:安裝 API
使用你程式語言專用的套件管理器來安裝 API。
安裝完成後,將必要的函式庫匯入你的開發環境。使用你的 API 金鑰初始化 API,開始與 Novita AI LLM 互動。以下是針對 Python 使用者使用聊天補全 API 的範例。
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="minimax/minimax-m2.5",
messages=[
{"role": "system", "content": "你是一個樂於助人的助手。"},
{"role": "user", "content": "你好,你最近怎麼樣?"}
],
max_tokens=131072,
temperature=0.7
)
print(response.choices[0].message.content)
將 MiniMax M2.5 與熱門工具整合
透過官方整合與逐步指南,輕鬆將 Novita AI 與夥伴平台連接,例如 Trae、Continue、Codex、OpenCode、AnythingLLM、LangChain、Dify、Langflow、Openclaw 等。
使用案例:MiniMax M2.5 的亮點
你也可以嘗試在軟體工程任務上嚴格測試 M2.5,看看它在封閉範圍內如何規劃與執行。M2.5 會輸出一個完整的優先規格計畫,包含 UI 線框圖和 API 端點。據此,它將新增超過 1200 行的 TypeScript/JavaScript 程式碼。測試在 22 分鐘內首次執行即通過,比 Claude Opus 4.6 的平均速度還要快。結果是一個具備 JWT 認證和 MongoDB 整合的實用應用程式。
建立一個使用 Node.js 後端進行使用者認證的 React 應用程式,包含資料庫結構。

來自 網站
Novita AI 上的 MiniMax M2.5 以前瞻性的代理式程式開發效能,提供了僅為高階替代方案十分之一的成本。 憑藉 SWE-Bench Verified 的 80.2%、比 M2.1 快 37% 的任務完成速度,以及每 100 萬個 Token $0.30/$1.20 的價格,它是生產環境 AI 程式開發代理、辦公室自動化及工具編排工作流程的最佳選擇。
常見問題
MiniMax M2.5 與 M2.1 相比如何?
M2.5 在 SWE-Bench 任務上快 37%,並在 SWE-Bench Verified 上達到 80.2%,而 M2.1 約為 70%。兩者在 Novita 上的定價相同(每 100 萬個 Token $0.30/$1.20),因此 M2.5 是明顯的升級選擇。
我可以自行託管 MiniMax M2.5 而不使用 Novita API 嗎?
可以,但需要 4 到 8 張 H100 GPU(在 Novita GPU 實例上最低每小時 $5.80)。自行託管只有在每月 Token 用量超過 5 億時才有經濟效益——對大多數開發者來說,API 遠更具成本效益。
MiniMax M2.5 支援函式呼叫嗎?
是的。M2.5 在超過 20 萬個真實環境中廣泛針對工具使用和函式呼叫進行訓練,在 BrowseComp(76.3%)和 Wide Search 基準測試中達到了 業界領先的效能。
Novita AI 是一個 AI 與代理雲端平台,協助開發者與新創公司以高效能、高可靠性和高成本效益的方式建置、部署並擴展模型與代理應用程式。
推薦閱讀
