MiniMax M2.5 存取指南:2026 年網頁、API、CLI、自托管方案

MiniMax M2.5 存取指南:2026 年網頁、API、CLI、自托管方案

MiniMax M2.5 是一款擁有 2290 億參數的稀疏混合專家(MoE)模型,儘管規模龐大,仍能實現高效推理。這款模型由中國 AI 公司 MiniMax 發布,在自主編程和網頁導航任務中屬於頂尖開源模型,在 SWE-Bench Verified 測試中達到 80.2% 的得分,在 BrowseComp 測試中達到 76.3%。

Novita 提供一款加速版模型,在保留前代版本強勁性能的同時,大幅提升推理速度。

立即體驗 MiniMax M2.5 高速版!

存取方式比較

方式 設定時間 成本(每日 100 萬 tokens) 適用場景
網頁測試平台 0 分鐘 免費(有速率限制) 首次評估、一次性任務
Novita AI API 2 分鐘 輸入:$0.3 /百萬 tokens
快取讀取:$0.03 /百萬 tokens
輸出:$1.2 /百萬 tokens
生產環境應用、中等流量、快速原型開發
NovitaClaw 5 分鐘 輸入:$0.3 /百萬 tokens
快取讀取:$0.03 /百萬 tokens
輸出:$1.2 /百萬 tokens
終端自動化、DevOps 工作流程
Claude Code 5 分鐘 輸入:$0.3 /百萬 tokens
快取讀取:$0.03 /百萬 tokens
輸出:$1.2 /百萬 tokens
程式碼庫探索、IDE 整合
本地部署(Q4_K_M) 30-60 分鐘 一次性投入:60,000–90,000 美元 高流量生產環境、數據隱私要求高的場景
雲端 GPU 5 分鐘 8 張 GPU 每小時 11.60 美元 短期實驗、突發流量工作負載、大模型測試

1. 網頁測試平台

Novita AI 的網頁測試平台是最快、零門檻的存取入口,無需註冊、無需 API 金鑰,即可立即進行評估。在決定投入 API 整合或本地部署之前,非常適合快速測試模型能力。

典型使用場景: 提示詞工程、品質評估、編程任務測試、與其他模型並列比對輸出結果。網頁測試平台非常適合首次評估和一次性任務,無需任何技術設定。

direct access to minimax m2.5

立即體驗 MiniMax M2.5!

2. Novita AI API(推薦給多數開發者)

為什麼選擇 Novita AI API?

  • 相容 OpenAI 與 Anthropic API 格式
  • ** competitively priced:每 100 萬 tokens 輸入 0.30 美元、輸出 1.20 美元**
  • 支援快取定價:快取定價機制允許你重複使用先前儲存的提示詞,減少重複計算,降低整體成本。

設定指南

步驟 1:登入並存取模型庫

登入你的帳號,點擊「模型庫」按鈕。

Log In and Access the Model Library

步驟 2:選擇模型

瀏覽可用的模型選項,選擇符合你需求的模型。

Choose Your Model

步驟 3:開始免費試用

開始免費試用,探索所選模型的能力。

Novita AI provides OpenAI-compatible endpoints for MiniMax M2.5

立即體驗平價 MiniMax M2.5!

步驟 4:取得 API 金鑰

要對 API 進行身份驗證,我們會為你提供新的 API 金鑰。進入「設定」頁面,即可按照圖片指示複製 API 金鑰。

get api key

步驟 5:安裝 API

使用你所用程式語言對應的套件管理器安裝 API。安裝完成後,將必要的函式庫匯入你的開發環境,使用 API 金鑰初始化 API,即可開始與 Novita AI 的大型語言模型互動。以下為 Python 使用者呼叫聊天補全 API 的範例:

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="minimax/minimax-m2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=131100,
    temperature=0.7
)

print(response.choices[0].message.content)

3. 程式碼工具存取

NovitaClaw

NovitaClaw 是一款用於在 Novita Agent Sandbox 上部署與管理持久化 OpenClaw 代理的命令列工具。只需單一指令,即可啟動完全託管的代理實例,持續運行,無會話限制也无需手動重啟。部署完成後,可透過 CLI、網頁 UI 或外部自動化腳本等多種介面存取與控制該代理。

快速開始

前置條件

開始前,請確保你已準備好:

  • 已安裝 Python
  • 擁有 Novita API 金鑰(可於**金鑰管理**頁面建立或管理金鑰)

步驟 1:安裝 NovitaClaw

macOS / Linux:

sudo pip3 install novitaclaw

Windows PowerShell:

pip install novitaclaw

驗證安裝:執行 novitaclaw --help,若看到指令列表,表示安裝成功。

步驟 2:設定 API 金鑰

macOS / Linux:

export NOVITA_API_KEY=sk_your_api_key

Windows PowerShell:

$env:NOVITA_API_KEY = "sk_your_api_key"

步驟 3:啟動實例

novitaclaw launch

成功執行後,CLI 會回傳以下資訊:

  • 網頁 UI 網址:與你的代理聊天
  • 閘道 WebSocket 網址與權杖:用於程式化存取
  • 網頁終端網址:瀏覽器型終端存取
  • 檔案管理器網址:管理工作區檔案
  • 登入憑證:用於網頁終端與檔案管理器

開啟網頁 UI 網址,進入「聊天」分頁,即可開始使用你的代理。

設定模型

你的實例預設會配置 Novita 託管的模型,若要自訂: 請前往: 設定 → 組態 → 原始(JSON5 檢視) 點擊「secrets redacted」以顯示完整組態。

步驟 1:註冊模型

models.providers.novita.models 下新增一筆項目:

{
  "models": {
    "providers": {
      "novita": {
        "models": [
          {
            "id": "model-id",
            "name": "display name",
            "reasoning": true,
            "input": ["text"],
            "contextWindow": 200000,
            "maxTokens": 50000
          }
        ]
      }
    }
  }
}
步驟 2:設為主要或備用模型

更新 agents.defaults

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "novita/model-id",
        "fallbacks": ["novita/fallback-model-id"]
      }
    }
  }
}

Claude Code

Claude Code 是 Anthropic 官方推出的命令列代理,主要為 Claude 模型設計,但相容 Novita AI 這類符合 Anthropic API 格式的端點。它在整個程式碼庫分析、複雜除錯和自主編程循環方面表現優異。

設定步驟:

  1. 安裝 Claude Code:
#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash

#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex

#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
#Windows requires Git for Windows. Install it first if you don’t have it.
  1. 設定環境變數:
# Set the Anthropic SDK compatible API endpoint provided by Novita.
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# Set the model provided by Novita.
export ANTHROPIC_MODEL="minimax/minimax-m2.5"
export ANTHROPIC_SMALL_FAST_MODEL="minimax/minimax-m2.5"
  1. 在你的專案中啟動 Claude Code:
cd /path/to/project
claude .

適用場景: 程式碼庫探索、多步驟除錯、自主功能實作、透過終端插件與 VSCode/Cursor 整合。

4. 本地部署

MiniMax M2.5 的稀疏 MoE 架構(總參數 229B,每 token 僅激活 10B)使得在高階消費級硬體或多 GPU 環境下進行本地部署成為可能。模型在完整 BF16 精度下需要 457GB 儲存空間,但透過 Unsloth 的 GGUF 量化技術,可將空間壓縮至 101GB(動態 3-bit)或 138GB(Q4_K_M)。

硬體需求

量化方式 所需 VRAM 硬體範例
BF16(完整精度) 457GB 6× H100 80GB
Q8_0 243GB 4× H100 80GB
Q6_K 188GB 3× H100 80GB
Q4_K_M(推薦) 138GB 2× H100 80GB
Q3_K_M 109GB 2× H100 80GB
UD-IQ2_XXS(最低要求) 74GB 單張 H100 80GB

安裝方式(llama.cpp)

git clone https://github.com/ggml-org/llama.cpp.git
cd llama.cpp

cmake -B build -DCMAKE_BUILD_TYPE=Release
cmake --build build -j"$(nproc)"

# Install HF CLI if needed
pip install -U "huggingface_hub[cli]"

# Download a specific quant (example: Q3_K_M)
hf download unsloth/MiniMax-M2.5-GGUF \
  --include "Q3_K_M/*" \
  --local-dir ./models

# Check files
find ./models -name "*.gguf"

# Run (use the FIRST shard)
./build/bin/llama-cli \
  -m ./models/Q3_K_M/MiniMax-M2.5-Q3_K_M-00001-of-00004.gguf \
  -p "Write a Python function to check if a number is prime"

雲端 GPU 安裝(高性價比方案)

步驟 1:註冊帳號

透過我們的網站建立 Novita AI 帳號。註冊完成後,前往左側邊欄的「探索」區塊,查看我們提供的 GPU 方案,開啟你的 AI 開發之旅。

Novita AI website screenshot

步驟 2: 瀏覽範本與 GPU 伺服器**

根據你的專案需求選擇對應的範本,例如 PyTorch、TensorFlow 或 CUDA。接著選擇你偏好的 GPU 配置,可選方案包括強勁的 L40S、RTX 4090 或 A100 SXM4,每種方案的 VRAM、RAM 和儲存規格都不同。

Exploring Templates and GPU Servers

步驟 3:自訂你的部署配置

選擇你偏好的作業系統與配置選項,自訂你的環境,確保能為你的特定 AI 工作負載與開發需求提供最佳效能。

Tailor Your Deployment

規格 計費方式 GPU 價格
H100 80GB VRAM 隨需應付 1 張 GPU 每小時 1.45 美元
8 張 GPU 每小時 11.60 美元
Spot 实例 1 張 GPU 每小時 0.73 美元
8 張 GPU 每小時 5.84 美元

立即體驗高性價比 GPU!

Novita AI 的 Spot 实例是一種成本優化的 GPU 租賃系統,會重用平台閒置或未使用的 GPU 容量。與預留專用硬體、適合穩定持續使用的隨需應付实例不同,Spot 实例是可中斷的——如果 GPU 被系統回收,你的任務可能會被暫停或終止。由於 Spot 模式會重新分配原本閒置的 GPU 資源,價格通常比隨需應付實例便宜 40–60%。

MiniMax M2.5 提供四種實用的存取路徑,各自針對不同場景優化。對多數開發者而言,Novita AI 的 API 每百萬 tokens 僅需 0.30/1.20 美元,是上線生產環境最快的方式——設定僅需 2 分鐘,且相容 OpenAI SDK。網頁測試平台適合首次評估,而 OpenClaw CLI 和 Claude Code 則能為進階使用者提供終端整合的代理工作流程。只有當每日用量超過 1000 萬 tokens,或嚴格數據隱私要求禁止使用雲端 API 時,自托管才具備經濟效益——這種情況下,在 2 張 H100 80GB 上運行 Q4_K_M 量化版本即可提供生產環境級效能。

常見問題

MiniMax M2.5 和其他編程模型有什麼不同?

MiniMax M2.5 採用稀疏 MoE 架構,總參數達 229B,但每 token 僅激活 10B,在 SWE-Bench Verified 測試中達到 80.2% 的得分,成本僅為 Claude Sonnet 4.5 的 8%。

我可以在單張消費級 GPU 上運行 MiniMax M2.5 嗎?

不行——即使採用激進的量化方式,最低 VRAM 需求也達到 74GB。

MiniMax M2.5 是否支援函數呼叫和結構化輸出?

是的——MiniMax M2.5 透過相容 OpenAI 的 API 格式支援函數呼叫。

Novita AI 是一款 AI 與代理雲端平台,協助開發者與新創公司以高效能、高可靠性和高成本效益建構、部署與擴展模型及代理應用程式。

推薦閱讀