MiniMax M2.5 是一款擁有 2290 億參數的稀疏混合專家(MoE)模型,儘管規模龐大,仍能實現高效推理。這款模型由中國 AI 公司 MiniMax 發布,在自主編程和網頁導航任務中屬於頂尖開源模型,在 SWE-Bench Verified 測試中達到 80.2% 的得分,在 BrowseComp 測試中達到 76.3%。
Novita 提供一款加速版模型,在保留前代版本強勁性能的同時,大幅提升推理速度。
存取方式比較
| 方式 | 設定時間 | 成本(每日 100 萬 tokens) | 適用場景 |
|---|---|---|---|
| 網頁測試平台 | 0 分鐘 | 免費(有速率限制) | 首次評估、一次性任務 |
| Novita AI API | 2 分鐘 | 輸入:$0.3 /百萬 tokens 快取讀取:$0.03 /百萬 tokens 輸出:$1.2 /百萬 tokens |
生產環境應用、中等流量、快速原型開發 |
| NovitaClaw | 5 分鐘 | 輸入:$0.3 /百萬 tokens 快取讀取:$0.03 /百萬 tokens 輸出:$1.2 /百萬 tokens |
終端自動化、DevOps 工作流程 |
| Claude Code | 5 分鐘 | 輸入:$0.3 /百萬 tokens 快取讀取:$0.03 /百萬 tokens 輸出:$1.2 /百萬 tokens |
程式碼庫探索、IDE 整合 |
| 本地部署(Q4_K_M) | 30-60 分鐘 | 一次性投入:60,000–90,000 美元 | 高流量生產環境、數據隱私要求高的場景 |
| 雲端 GPU | 5 分鐘 | 8 張 GPU 每小時 11.60 美元 | 短期實驗、突發流量工作負載、大模型測試 |
1. 網頁測試平台
Novita AI 的網頁測試平台是最快、零門檻的存取入口,無需註冊、無需 API 金鑰,即可立即進行評估。在決定投入 API 整合或本地部署之前,非常適合快速測試模型能力。
典型使用場景: 提示詞工程、品質評估、編程任務測試、與其他模型並列比對輸出結果。網頁測試平台非常適合首次評估和一次性任務,無需任何技術設定。

2. Novita AI API(推薦給多數開發者)
為什麼選擇 Novita AI API?
- 相容 OpenAI 與 Anthropic API 格式
- ** competitively priced:每 100 萬 tokens 輸入 0.30 美元、輸出 1.20 美元**
- 支援快取定價:快取定價機制允許你重複使用先前儲存的提示詞,減少重複計算,降低整體成本。
設定指南
步驟 1:登入並存取模型庫
登入你的帳號,點擊「模型庫」按鈕。

步驟 2:選擇模型
瀏覽可用的模型選項,選擇符合你需求的模型。

步驟 3:開始免費試用
開始免費試用,探索所選模型的能力。

步驟 4:取得 API 金鑰
要對 API 進行身份驗證,我們會為你提供新的 API 金鑰。進入「設定」頁面,即可按照圖片指示複製 API 金鑰。

步驟 5:安裝 API
使用你所用程式語言對應的套件管理器安裝 API。安裝完成後,將必要的函式庫匯入你的開發環境,使用 API 金鑰初始化 API,即可開始與 Novita AI 的大型語言模型互動。以下為 Python 使用者呼叫聊天補全 API 的範例:
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="minimax/minimax-m2.5",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=131100,
temperature=0.7
)
print(response.choices[0].message.content)
3. 程式碼工具存取
NovitaClaw
NovitaClaw 是一款用於在 Novita Agent Sandbox 上部署與管理持久化 OpenClaw 代理的命令列工具。只需單一指令,即可啟動完全託管的代理實例,持續運行,無會話限制也无需手動重啟。部署完成後,可透過 CLI、網頁 UI 或外部自動化腳本等多種介面存取與控制該代理。
快速開始
前置條件
開始前,請確保你已準備好:
- 已安裝 Python
- 擁有 Novita API 金鑰(可於**金鑰管理**頁面建立或管理金鑰)
步驟 1:安裝 NovitaClaw
macOS / Linux:
sudo pip3 install novitaclaw
Windows PowerShell:
pip install novitaclaw
驗證安裝:執行 novitaclaw --help,若看到指令列表,表示安裝成功。
步驟 2:設定 API 金鑰
macOS / Linux:
export NOVITA_API_KEY=sk_your_api_key
Windows PowerShell:
$env:NOVITA_API_KEY = "sk_your_api_key"
步驟 3:啟動實例
novitaclaw launch
成功執行後,CLI 會回傳以下資訊:
- 網頁 UI 網址:與你的代理聊天
- 閘道 WebSocket 網址與權杖:用於程式化存取
- 網頁終端網址:瀏覽器型終端存取
- 檔案管理器網址:管理工作區檔案
- 登入憑證:用於網頁終端與檔案管理器
開啟網頁 UI 網址,進入「聊天」分頁,即可開始使用你的代理。
設定模型
你的實例預設會配置 Novita 託管的模型,若要自訂: 請前往: 設定 → 組態 → 原始(JSON5 檢視) 點擊「secrets redacted」以顯示完整組態。
步驟 1:註冊模型
在 models.providers.novita.models 下新增一筆項目:
{
"models": {
"providers": {
"novita": {
"models": [
{
"id": "model-id",
"name": "display name",
"reasoning": true,
"input": ["text"],
"contextWindow": 200000,
"maxTokens": 50000
}
]
}
}
}
}
步驟 2:設為主要或備用模型
更新 agents.defaults:
{
"agents": {
"defaults": {
"model": {
"primary": "novita/model-id",
"fallbacks": ["novita/fallback-model-id"]
}
}
}
}
Claude Code
Claude Code 是 Anthropic 官方推出的命令列代理,主要為 Claude 模型設計,但相容 Novita AI 這類符合 Anthropic API 格式的端點。它在整個程式碼庫分析、複雜除錯和自主編程循環方面表現優異。
設定步驟:
- 安裝 Claude Code:
#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash
#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex
#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
#Windows requires Git for Windows. Install it first if you don’t have it.
- 設定環境變數:
# Set the Anthropic SDK compatible API endpoint provided by Novita.
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# Set the model provided by Novita.
export ANTHROPIC_MODEL="minimax/minimax-m2.5"
export ANTHROPIC_SMALL_FAST_MODEL="minimax/minimax-m2.5"
- 在你的專案中啟動 Claude Code:
cd /path/to/project
claude .
適用場景: 程式碼庫探索、多步驟除錯、自主功能實作、透過終端插件與 VSCode/Cursor 整合。
4. 本地部署
MiniMax M2.5 的稀疏 MoE 架構(總參數 229B,每 token 僅激活 10B)使得在高階消費級硬體或多 GPU 環境下進行本地部署成為可能。模型在完整 BF16 精度下需要 457GB 儲存空間,但透過 Unsloth 的 GGUF 量化技術,可將空間壓縮至 101GB(動態 3-bit)或 138GB(Q4_K_M)。
硬體需求
| 量化方式 | 所需 VRAM | 硬體範例 |
|---|---|---|
| BF16(完整精度) | 457GB | 6× H100 80GB |
| Q8_0 | 243GB | 4× H100 80GB |
| Q6_K | 188GB | 3× H100 80GB |
| Q4_K_M(推薦) | 138GB | 2× H100 80GB |
| Q3_K_M | 109GB | 2× H100 80GB |
| UD-IQ2_XXS(最低要求) | 74GB | 單張 H100 80GB |
安裝方式(llama.cpp)
git clone https://github.com/ggml-org/llama.cpp.git
cd llama.cpp
cmake -B build -DCMAKE_BUILD_TYPE=Release
cmake --build build -j"$(nproc)"
# Install HF CLI if needed
pip install -U "huggingface_hub[cli]"
# Download a specific quant (example: Q3_K_M)
hf download unsloth/MiniMax-M2.5-GGUF \
--include "Q3_K_M/*" \
--local-dir ./models
# Check files
find ./models -name "*.gguf"
# Run (use the FIRST shard)
./build/bin/llama-cli \
-m ./models/Q3_K_M/MiniMax-M2.5-Q3_K_M-00001-of-00004.gguf \
-p "Write a Python function to check if a number is prime"
雲端 GPU 安裝(高性價比方案)
步驟 1:註冊帳號
透過我們的網站建立 Novita AI 帳號。註冊完成後,前往左側邊欄的「探索」區塊,查看我們提供的 GPU 方案,開啟你的 AI 開發之旅。

步驟 2: 瀏覽範本與 GPU 伺服器**
根據你的專案需求選擇對應的範本,例如 PyTorch、TensorFlow 或 CUDA。接著選擇你偏好的 GPU 配置,可選方案包括強勁的 L40S、RTX 4090 或 A100 SXM4,每種方案的 VRAM、RAM 和儲存規格都不同。

步驟 3:自訂你的部署配置
選擇你偏好的作業系統與配置選項,自訂你的環境,確保能為你的特定 AI 工作負載與開發需求提供最佳效能。

| 規格 | 計費方式 | GPU | 價格 |
|---|---|---|---|
| H100 80GB VRAM | 隨需應付 | 1 張 GPU | 每小時 1.45 美元 |
| 8 張 GPU | 每小時 11.60 美元 | ||
| Spot 实例 | 1 張 GPU | 每小時 0.73 美元 | |
| 8 張 GPU | 每小時 5.84 美元 |
Novita AI 的 Spot 实例是一種成本優化的 GPU 租賃系統,會重用平台閒置或未使用的 GPU 容量。與預留專用硬體、適合穩定持續使用的隨需應付实例不同,Spot 实例是可中斷的——如果 GPU 被系統回收,你的任務可能會被暫停或終止。由於 Spot 模式會重新分配原本閒置的 GPU 資源,價格通常比隨需應付實例便宜 40–60%。
MiniMax M2.5 提供四種實用的存取路徑,各自針對不同場景優化。對多數開發者而言,Novita AI 的 API 每百萬 tokens 僅需 0.30/1.20 美元,是上線生產環境最快的方式——設定僅需 2 分鐘,且相容 OpenAI SDK。網頁測試平台適合首次評估,而 OpenClaw CLI 和 Claude Code 則能為進階使用者提供終端整合的代理工作流程。只有當每日用量超過 1000 萬 tokens,或嚴格數據隱私要求禁止使用雲端 API 時,自托管才具備經濟效益——這種情況下,在 2 張 H100 80GB 上運行 Q4_K_M 量化版本即可提供生產環境級效能。
常見問題
MiniMax M2.5 和其他編程模型有什麼不同?
MiniMax M2.5 採用稀疏 MoE 架構,總參數達 229B,但每 token 僅激活 10B,在 SWE-Bench Verified 測試中達到 80.2% 的得分,成本僅為 Claude Sonnet 4.5 的 8%。
我可以在單張消費級 GPU 上運行 MiniMax M2.5 嗎?
不行——即使採用激進的量化方式,最低 VRAM 需求也達到 74GB。
MiniMax M2.5 是否支援函數呼叫和結構化輸出?
是的——MiniMax M2.5 透過相容 OpenAI 的 API 格式支援函數呼叫。
Novita AI 是一款 AI 與代理雲端平台,協助開發者與新創公司以高效能、高可靠性和高成本效益建構、部署與擴展模型及代理應用程式。
推薦閱讀

