MiniMax M2.5 在 Novita AI 上:設定指南與成本分析

MiniMax M2.5 在 Novita AI 上:設定指南與成本分析

MiniMax M2.5 是市面上最快、最具成本效益的 AI 程式碼開發代理之一。透過 Novita AI,你只需每 100 萬個 Token 支付 $0.30/$1.20 即可使用。M2.5 在 SWE-Bench Verified 上達到 80.2%,在 Multi-SWE-Bench 上達到 51.3%,提供頂尖的程式碼開發效能,同時任務完成速度比 M2.1 快 37%——以極低的成本達到與 Claude Opus 4.6 相當的速度。

本指南將精準示範如何透過 Novita AI 的 OpenAI 相容 API 存取 MiniMax M2.5、將其部署至正式環境工作負載,並充分發揮其在代理式程式開發、工具使用及辦公室自動化方面的獨特優勢。

立即試用強大且價格實惠的 MiniMax M2.5!

MiniMax M2.5 是什麼?

MiniMax M2.5 是一款 2287 億參數的混合專家(MoE)模型,專為真實世界的生產力任務而訓練。它擁有 256 個專家,每次 Token 啟動 8 個專家,在程式開發、代理式工具使用、網頁搜尋及辦公室自動化方面均能提供前沿效能,同時維持極高的推論效率。

MiniMax M2.5 的架構

規格 MiniMax M2.5
總參數 229B
架構 混合專家(MoE)
專家數量 256 個總數,每次 Token 啟動 8 個
語境長度 196,608 個 Token(約 196K)
隱藏層大小 3072
層數 62
詞彙量 200,064

MiniMax M2.5 的基準測試

MiniMax M2.5 在程式開發、代理任務及辦公室自動化基準測試中均達到頂尖成果——效能堪比定價高出 3 到 5 倍的模型,成本卻低得多。該模型在超過 20 萬個真實環境中透過強化學習進行訓練,因此在實際任務中具備無與倫比的泛化能力。

程式開發與代理及工具使用

MiniMax M2.5 的程式開發與代理及工具使用

來自 HuggingFace

MiniMax M2.5 的程式開發與代理及工具使用

來自 HuggingFace

MiniMax M2.5 並非在所有基準測試中都佔據主導地位,但在模擬、檢索及多輪推理任務上始終保持強勁表現。其效能輪廓顯示:

  • 強大的代理式任務協調能力
  • 穩健的檢索與搜尋整合
  • 穩定的多輪推理
  • 具競爭力的結構化環境模擬

總體而言,MiniMax M2.5 似乎專為實際的代理工作流程及複雜的多步驟執行而最佳化,而非純學術性的推理基準。

辦公室自動化

MiniMax M2.5 並非設計用來主導抽象學術推理基準或純數學競賽。其優勢在於專業的辦公室執行任務,尤其是需要結構化、可交付成果的任務。

基準測試 MiniMax M2.5 MiniMax M2.1 Claude Opus 4.5 Claude Opus 4.6 Gemini 3 Pro GPT-5.2
GDPval-MM 59.0 24.6 61.1 73.5 28.1 54.5
MEWC 74.4 55.6 82.1 89.8 78.7 41.3
財務建模 21.6 17.3 30.1 33.2 15.0 20.0

立即試用強大且價格實惠的 MiniMax M2.5!

MiniMax M2.5 的速度

為什麼 M2.5 的速度很重要: 完成 SWE-Bench 的速度比 M2.1 快 37%,這意味著更低的 API 成本以及更快的迭代週期。對於典型的跨檔案重構任務,M2.5 只需 45 秒即可完成,而 M2.1 則需要 70 秒——在大規模使用時,既能節省時間也能節省成本。

為什麼選擇 Novita AI 上的 MiniMax M2.5?

Novita AI 在生產環境中執行 MiniMax M2.5 提供了最佳的性價比。雖然自行託管需要 4 到 8 張 H100 GPU(最低每小時 $5.80),但 Novita 的無伺服器 API 僅需每 100 萬個輸入 Token $0.30、每 100 萬個輸出 Token $1.20——且無需基礎設施開銷、可即時擴展,並提供 99.5% 正常運行時間 SLA。

Novita AI 在 MiniMax M2.5 上的主要優勢:

功能 Novita AI 自行託管
設定時間 2 分鐘(API 金鑰) 2 到 5 天(GPU 佈建 + 設定)
成本模型 按 Token 計費(每 100 萬個 $0.30/$1.20) 固定 GPU 租用(4 張 H100 每小時 $5.80+)
擴展 即時自動擴展 手動 GPU 佈建
維護 無需維護(託管服務) 維護工作量大(vLLM、驅動程式、更新)
可用性 99.5% SLA 取決於你的基礎設施
最適合 變動工作負載、快速原型開發、生產 API 全天候高用量推論且負載可預測

如何在 Novita AI 上存取 MiniMax M2.5

步驟 1:登入並存取模型庫

登入你的帳號,然後點擊 模型庫 按鈕。

登入並存取模型庫

步驟 2:選擇你的模型

瀏覽可用的選項,然後選擇符合你需求的模型。

選擇你的模型

步驟 3:開始免費試用

開始免費試用,探索所選模型的功能。

Novita AI 為 MiniMax M2.5 提供 OpenAI 相容的端點

立即試用強大且價格實惠的 MiniMax M2.5!

步驟 4:取得你的 API 金鑰

為了驗證 API,我們將為你提供一個新的 API 金鑰。進入「設定」頁面後,你可以依照圖片指示複製 API 金鑰。

取得 API 金鑰

步驟 5:安裝 API

使用你程式語言專用的套件管理器來安裝 API。

安裝完成後,將必要的函式庫匯入你的開發環境。使用你的 API 金鑰初始化 API,開始與 Novita AI LLM 互動。以下是針對 Python 使用者使用聊天補全 API 的範例。

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="minimax/minimax-m2.5",
    messages=[
        {"role": "system", "content": "你是一個樂於助人的助手。"},
        {"role": "user", "content": "你好,你最近怎麼樣?"}
    ],
    max_tokens=131072,
    temperature=0.7
)

print(response.choices[0].message.content)

將 MiniMax M2.5 與熱門工具整合

透過官方整合與逐步指南,輕鬆將 Novita AI 與夥伴平台連接,例如 TraeContinueCodexOpenCodeAnythingLLMLangChainDifyLangflowOpenclaw 等。

使用案例:MiniMax M2.5 的亮點

你也可以嘗試在軟體工程任務上嚴格測試 M2.5,看看它在封閉範圍內如何規劃與執行。M2.5 會輸出一個完整的優先規格計畫,包含 UI 線框圖和 API 端點。據此,它將新增超過 1200 行的 TypeScript/JavaScript 程式碼。測試在 22 分鐘內首次執行即通過,比 Claude Opus 4.6 的平均速度還要快。結果是一個具備 JWT 認證和 MongoDB 整合的實用應用程式。

建立一個使用 Node.js 後端進行使用者認證的 React 應用程式,包含資料庫結構。

來自 網站

立即試用強大且價格實惠的 MiniMax M2.5!

Novita AI 上的 MiniMax M2.5 以前瞻性的代理式程式開發效能,提供了僅為高階替代方案十分之一的成本。 憑藉 SWE-Bench Verified 的 80.2%、比 M2.1 快 37% 的任務完成速度,以及每 100 萬個 Token $0.30/$1.20 的價格,它是生產環境 AI 程式開發代理、辦公室自動化及工具編排工作流程的最佳選擇。

常見問題

MiniMax M2.5 與 M2.1 相比如何?

M2.5 在 SWE-Bench 任務上快 37%,並在 SWE-Bench Verified 上達到 80.2%,而 M2.1 約為 70%。兩者在 Novita 上的定價相同(每 100 萬個 Token $0.30/$1.20),因此 M2.5 是明顯的升級選擇。

我可以自行託管 MiniMax M2.5 而不使用 Novita API 嗎?

可以,但需要 4 到 8 張 H100 GPU(在 Novita GPU 實例上最低每小時 $5.80)。自行託管只有在每月 Token 用量超過 5 億時才有經濟效益——對大多數開發者來說,API 遠更具成本效益。

MiniMax M2.5 支援函式呼叫嗎?

是的。M2.5 在超過 20 萬個真實環境中廣泛針對工具使用和函式呼叫進行訓練,在 BrowseComp(76.3%)和 Wide Search 基準測試中達到了 業界領先的效能

Novita AI 是一個 AI 與代理雲端平台,協助開發者與新創公司以高效能、高可靠性和高成本效益的方式建置、部署並擴展模型與代理應用程式。

推薦閱讀