MiniMax M2.5 存取指南：2026 年網頁、API、CLI、自托管方案

存取方式比較
1\. 網頁測試平台
2\. Novita AI API（推薦給多數開發者）
3\. 程式碼工具存取
4\. 本地部署

MiniMax M2.5 是一款擁有 2290 億參數的稀疏混合專家（MoE）模型，儘管規模龐大，仍能實現高效推理。這款模型由中國 AI 公司 MiniMax 發布，在自主編程和網頁導航任務中屬於頂尖開源模型，在 SWE-Bench Verified 測試中達到 80.2% 的得分，在 BrowseComp 測試中達到 76.3%。

Novita 提供一款加速版模型，在保留前代版本強勁性能的同時，大幅提升推理速度。

立即體驗 MiniMax M2.5 高速版！

存取方式比較

方式	設定時間	成本（每日 100 萬 tokens）	適用場景
網頁測試平台	0 分鐘	免費（有速率限制）	首次評估、一次性任務
Novita AI API	2 分鐘	輸入：$0.3 /百萬 tokens 快取讀取：$0.03 /百萬 tokens 輸出：$1.2 /百萬 tokens	生產環境應用、中等流量、快速原型開發
NovitaClaw	5 分鐘	輸入：$0.3 /百萬 tokens 快取讀取：$0.03 /百萬 tokens 輸出：$1.2 /百萬 tokens	終端自動化、DevOps 工作流程
Claude Code	5 分鐘	輸入：$0.3 /百萬 tokens 快取讀取：$0.03 /百萬 tokens 輸出：$1.2 /百萬 tokens	程式碼庫探索、IDE 整合
本地部署（Q4_K_M）	30-60 分鐘	一次性投入：60,000–90,000 美元	高流量生產環境、數據隱私要求高的場景
雲端 GPU	5 分鐘	8 張 GPU 每小時 11.60 美元	短期實驗、突發流量工作負載、大模型測試

1. 網頁測試平台

Novita AI 的網頁測試平台是最快、零門檻的存取入口，無需註冊、無需 API 金鑰，即可立即進行評估。在決定投入 API 整合或本地部署之前，非常適合快速測試模型能力。

典型使用場景： 提示詞工程、品質評估、編程任務測試、與其他模型並列比對輸出結果。網頁測試平台非常適合首次評估和一次性任務，無需任何技術設定。

立即體驗 MiniMax M2.5！

2. Novita AI API（推薦給多數開發者）

為什麼選擇 Novita AI API？

相容 OpenAI 與 Anthropic API 格式
** competitively priced：每 100 萬 tokens 輸入 0.30 美元、輸出 1.20 美元**
支援快取定價：快取定價機制允許你重複使用先前儲存的提示詞，減少重複計算，降低整體成本。

設定指南

步驟 1：登入並存取模型庫

登入你的帳號，點擊「模型庫」按鈕。

步驟 2：選擇模型

瀏覽可用的模型選項，選擇符合你需求的模型。

步驟 3：開始免費試用

開始免費試用，探索所選模型的能力。

立即體驗平價 MiniMax M2.5！

步驟 4：取得 API 金鑰

要對 API 進行身份驗證，我們會為你提供新的 API 金鑰。進入「設定」頁面，即可按照圖片指示複製 API 金鑰。

步驟 5：安裝 API

使用你所用程式語言對應的套件管理器安裝 API。安裝完成後，將必要的函式庫匯入你的開發環境，使用 API 金鑰初始化 API，即可開始與 Novita AI 的大型語言模型互動。以下為 Python 使用者呼叫聊天補全 API 的範例：

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="minimax/minimax-m2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=131100,
    temperature=0.7
)

print(response.choices[0].message.content)

3. 程式碼工具存取

NovitaClaw

NovitaClaw 是一款用於在 Novita Agent Sandbox 上部署與管理持久化 OpenClaw 代理的命令列工具。只需單一指令，即可啟動完全託管的代理實例，持續運行，無會話限制也无需手動重啟。部署完成後，可透過 CLI、網頁 UI 或外部自動化腳本等多種介面存取與控制該代理。

快速開始

前置條件

開始前，請確保你已準備好：

已安裝 Python
擁有 Novita API 金鑰（可於**金鑰管理**頁面建立或管理金鑰）

步驟 1：安裝 NovitaClaw

macOS / Linux：

sudo pip3 install novitaclaw

Windows PowerShell：

pip install novitaclaw

驗證安裝：執行 novitaclaw --help，若看到指令列表，表示安裝成功。

步驟 2：設定 API 金鑰

macOS / Linux：

export NOVITA_API_KEY=sk_your_api_key

Windows PowerShell：

$env:NOVITA_API_KEY = "sk_your_api_key"

步驟 3：啟動實例

novitaclaw launch

成功執行後，CLI 會回傳以下資訊：

網頁 UI 網址：與你的代理聊天
閘道 WebSocket 網址與權杖：用於程式化存取
網頁終端網址：瀏覽器型終端存取
檔案管理器網址：管理工作區檔案
登入憑證：用於網頁終端與檔案管理器

開啟網頁 UI 網址，進入「聊天」分頁，即可開始使用你的代理。

設定模型

你的實例預設會配置 Novita 託管的模型，若要自訂：請前往： 設定 → 組態 → 原始（JSON5 檢視） 點擊「secrets redacted」以顯示完整組態。

步驟 1：註冊模型

在 models.providers.novita.models 下新增一筆項目：

{
  "models": {
    "providers": {
      "novita": {
        "models": [
          {
            "id": "model-id",
            "name": "display name",
            "reasoning": true,
            "input": ["text"],
            "contextWindow": 200000,
            "maxTokens": 50000
          }
        ]
      }
    }
  }
}

步驟 2：設為主要或備用模型

更新 agents.defaults：

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "novita/model-id",
        "fallbacks": ["novita/fallback-model-id"]
      }
    }
  }
}

Claude Code

Claude Code 是 Anthropic 官方推出的命令列代理，主要為 Claude 模型設計，但相容 Novita AI 這類符合 Anthropic API 格式的端點。它在整個程式碼庫分析、複雜除錯和自主編程循環方面表現優異。

設定步驟：

安裝 Claude Code：

#macOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bash

#Windows PowerShell:
irm https://claude.ai/install.ps1 | iex

#Windows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
#Windows requires Git for Windows. Install it first if you don’t have it.

設定環境變數：

# Set the Anthropic SDK compatible API endpoint provided by Novita.
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
# Set the model provided by Novita.
export ANTHROPIC_MODEL="minimax/minimax-m2.5"
export ANTHROPIC_SMALL_FAST_MODEL="minimax/minimax-m2.5"

在你的專案中啟動 Claude Code：

cd /path/to/project
claude .

適用場景： 程式碼庫探索、多步驟除錯、自主功能實作、透過終端插件與 VSCode/Cursor 整合。

4. 本地部署

MiniMax M2.5 的稀疏 MoE 架構（總參數 229B，每 token 僅激活 10B）使得在高階消費級硬體或多 GPU 環境下進行本地部署成為可能。模型在完整 BF16 精度下需要 457GB 儲存空間，但透過 Unsloth 的 GGUF 量化技術，可將空間壓縮至 101GB（動態 3-bit）或 138GB（Q4_K_M）。

硬體需求

量化方式	所需 VRAM	硬體範例
BF16（完整精度）	457GB	6× H100 80GB
Q8_0	243GB	4× H100 80GB
Q6_K	188GB	3× H100 80GB
Q4_K_M（推薦）	138GB	2× H100 80GB
Q3_K_M	109GB	2× H100 80GB
UD-IQ2_XXS（最低要求）	74GB	單張 H100 80GB

安裝方式（llama.cpp）

git clone https://github.com/ggml-org/llama.cpp.git
cd llama.cpp

cmake -B build -DCMAKE_BUILD_TYPE=Release
cmake --build build -j"$(nproc)"

# Install HF CLI if needed
pip install -U "huggingface_hub[cli]"

# Download a specific quant (example: Q3_K_M)
hf download unsloth/MiniMax-M2.5-GGUF \
  --include "Q3_K_M/*" \
  --local-dir ./models

# Check files
find ./models -name "*.gguf"

# Run (use the FIRST shard)
./build/bin/llama-cli \
  -m ./models/Q3_K_M/MiniMax-M2.5-Q3_K_M-00001-of-00004.gguf \
  -p "Write a Python function to check if a number is prime"

雲端 GPU 安裝（高性價比方案）

步驟 1：註冊帳號

透過我們的網站建立 Novita AI 帳號。註冊完成後，前往左側邊欄的「探索」區塊，查看我們提供的 GPU 方案，開啟你的 AI 開發之旅。

步驟 2： 瀏覽範本與 GPU 伺服器**

根據你的專案需求選擇對應的範本，例如 PyTorch、TensorFlow 或 CUDA。接著選擇你偏好的 GPU 配置，可選方案包括強勁的 L40S、RTX 4090 或 A100 SXM4，每種方案的 VRAM、RAM 和儲存規格都不同。

步驟 3：自訂你的部署配置

選擇你偏好的作業系統與配置選項，自訂你的環境，確保能為你的特定 AI 工作負載與開發需求提供最佳效能。

規格	計費方式	GPU	價格
H100 80GB VRAM	隨需應付	1 張 GPU	每小時 1.45 美元
		8 張 GPU	每小時 11.60 美元
	Spot 实例	1 張 GPU	每小時 0.73 美元
		8 張 GPU	每小時 5.84 美元

立即體驗高性價比 GPU！

Novita AI 的 Spot 实例是一種成本優化的 GPU 租賃系統，會重用平台閒置或未使用的 GPU 容量。與預留專用硬體、適合穩定持續使用的隨需應付实例不同，Spot 实例是可中斷的——如果 GPU 被系統回收，你的任務可能會被暫停或終止。由於 Spot 模式會重新分配原本閒置的 GPU 資源，價格通常比隨需應付實例便宜 40–60%。

MiniMax M2.5 提供四種實用的存取路徑，各自針對不同場景優化。對多數開發者而言，Novita AI 的 API 每百萬 tokens 僅需 0.30/1.20 美元，是上線生產環境最快的方式——設定僅需 2 分鐘，且相容 OpenAI SDK。網頁測試平台適合首次評估，而 OpenClaw CLI 和 Claude Code 則能為進階使用者提供終端整合的代理工作流程。只有當每日用量超過 1000 萬 tokens，或嚴格數據隱私要求禁止使用雲端 API 時，自托管才具備經濟效益——這種情況下，在 2 張 H100 80GB 上運行 Q4_K_M 量化版本即可提供生產環境級效能。

常見問題

MiniMax M2.5 和其他編程模型有什麼不同？

MiniMax M2.5 採用稀疏 MoE 架構，總參數達 229B，但每 token 僅激活 10B，在 SWE-Bench Verified 測試中達到 80.2% 的得分，成本僅為 Claude Sonnet 4.5 的 8%。

我可以在單張消費級 GPU 上運行 MiniMax M2.5 嗎？

不行——即使採用激進的量化方式，最低 VRAM 需求也達到 74GB。

MiniMax M2.5 是否支援函數呼叫和結構化輸出？

是的——MiniMax M2.5 透過相容 OpenAI 的 API 格式支援函數呼叫。

Novita AI 是一款 AI 與代理雲端平台，協助開發者與新創公司以高效能、高可靠性和高成本效益建構、部署與擴展模型及代理應用程式。

推薦閱讀

MiniMax M2.5 存取指南：2026 年網頁、API、CLI、自托管方案

存取方式比較

1. 網頁測試平台

2. Novita AI API（推薦給多數開發者）

為什麼選擇 Novita AI API？

設定指南

3. 程式碼工具存取

NovitaClaw

快速開始

步驟 1：安裝 NovitaClaw

步驟 2：設定 API 金鑰

步驟 3：啟動實例

設定模型

步驟 1：註冊模型

步驟 2：設為主要或備用模型

Claude Code

4. 本地部署

硬體需求

安裝方式（llama.cpp）

雲端 GPU 安裝（高性價比方案）

Product

RESOURCES

Partners

Company

存取方式比較

1. 網頁測試平台

2. Novita AI API（推薦給多數開發者）

為什麼選擇 Novita AI API？

設定指南

3. 程式碼工具存取

NovitaClaw

快速開始

步驟 1：安裝 NovitaClaw

步驟 2：設定 API 金鑰

步驟 3：啟動實例

設定模型

步驟 1：註冊模型

步驟 2：設為主要或備用模型

Claude Code

4. 本地部署

硬體需求

安裝方式（llama.cpp）

雲端 GPU 安裝（高性價比方案）

相關文章

Product

RESOURCES

Partners

Company