存取最先進的 AI 模型不應該需要數週的基礎設施設定。Kimi K2.5 提供四種使用途徑:網頁遊樂場(零設定)、Novita AI API(3 行程式碼)、程式碼工具整合(Claude Code、Cursor、Continue),以及本地部署(375GB 以上的基礎設施)。
本指南涵蓋所有存取方式——從最簡單到最高階——設定時間從約 30 秒(網頁存取)到數天(自行架設)不等。API 存取定價為每 100 萬個 Token $0.60 / $3.00,提供生產級效能,無需管理 GPU 叢集的營運負擔。
Kimi K2.5 模型介紹
Kimi K2.5 的新功能
Kimi K2.5 引入了 Agent Swarm 模式,可協調多達 100 個專門的子代理同時執行工作流程。透過動態生成代理來處理並行任務,相較於循序處理,執行速度快了 4.5 倍。該模型還能維持在 200–300 次連續工具呼叫期間的穩定效能而不產生偏差,解決了許多模型在長時間代理對話中失去連貫性的常見失敗點。

來自 Kimi
核心規格
| 開發者 | Moonshot AI |
| 參數量 | 總計 1 兆,活躍參數 32B(MoE 架構) |
| 上下文視窗 | 256K 個 Token |
| 模態 | 文字、視覺 |
| 操作模式 | 即時(3-8 秒)、思考(推理軌跡)、代理(搜尋/程式碼/網頁)、Agent Swarm(平行協調) |
基準測試表現
整體而言,Kimi K2.5 在以下領域表現特別出色:
- 代理搜尋與自主研究
- 數學推理
- 基於文件/OCR 的視覺任務
- 長影片多模態理解
| 類別 | 基準測試 | Kimi K2.5 | GPT-5.2 |
|---|---|---|---|
| 推理 | HLE-Full | 30.1 | 34.5 |
| HLE-Full(搭配工具) | 50.2 | 45.5 | |
| AIME 2025 | 96.1 | 100 | |
| HMMT 2025 | 95.4 | 99.4 | |
| IMO-AnswerBench | 81.8 | 86.3 | |
| GPQA-Diamond | 87.6 | 92.4 | |
| MMLU-Pro | 87.1 | 86.7 | |
| 視覺 / 多模態 | MMMU-Pro | 78.5 | 79.5 |
| MathVision | 84.2 | 83.0 | |
| MathVista | 90.1 | 82.8 | |
| OCRBench | 92.3 | 80.7 | |
| InfoVQA | 92.6 | 84.0 | |
| SimpleVQA | 71.2 | 55.8 | |
| 影片理解 | VideoMMMU | 86.6 | 85.9 |
| MotionBench | 70.4 | 64.8 | |
| LongVideoBench | 79.8 | 76.5 | |
| 程式碼 | SWE-Bench Verified | 76.8 | 80.0 |
| SWE-Bench Pro | 50.7 | 55.6 | |
| TerminalBench | 50.8 | 54.0 | |
| LiveCodeBench | 85.0 | — | |
| 代理搜尋 | BrowseComp | 60.6 | 65.8 |
| BrowseComp (Agent Swarm) | 78.4 | — | |
| DeepSearchQA | 77.1 | 71.3 |
存取方式一:Novita AI 遊樂場
Novita 的遊樂場提供一種無需設定負擔的直覺方式來探索和使用 Kimi K2.5。您可以直接在聊天或補全介面中與模型互動,即時調整溫度(temperature)和最大 Token 數(max tokens)等參數,並立即觀察輸出的變化。這讓您能夠在整合到應用程式之前,先行測試提示詞、優化系統指令以及評估回應品質。

存取方式二:Novita AI API 存取(適用開發者)
提供生產級程式化存取,相容 OpenAI 端點。 Novita AI 提供 Kimi K2.5 的即時 API 存取,輸入價格為每 100 萬個 Token $0.60,輸出價格為每 100 萬個 Token $3.00 —— 對於同等推理任務,比 Claude Opus 4.5 便宜 76%。其相容 OpenAI 的端點意味著您現有的程式碼僅需兩項設定變更:base URL 和 API 金鑰。

取得您的 API 金鑰
透過 API 整合
安裝 OpenAI SDK 並連接到 Novita 的端點:
pip install openai
from openai import OpenAI
client = OpenAI(
api_key="<Your API Key>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.5",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=262144,
temperature=0.7
)
print(response.choices[0].message.content)
存取方式三:程式碼工具整合
將 Kimi K2.5 整合到您的開發環境中,以實現代理式編碼工作流程。這些工具提供終端機自動化、IDE 整合以及多步驟任務執行能力,利用了 Kimi 擴展的工具呼叫穩定性。
透過官方整合和逐步指南,輕鬆將 Novita AI 與合作平台(如 Trae、Continue、Codex、OpenCode、AnythingLLM、LangChain、Dify、Langflow 和 Openclaw)串接起來。
Claude Code
最適合: 基於終端機的工作流程、Git 操作、檔案系統任務,以及偏好使用鍵盤驅動開發的開發者。
Claude Code 是 Anthropic 的官方 CLI 代理。雖然專為 Claude 模型設計,但它透過環境變數支援自訂模型端點。設定只需 2 分鐘:
# Install Claude Code
npm install -g @anthropic-ai/claude-code
# Configure for Kimi K2.5 via Novita
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="YOUR_NOVITA_API_KEY"
export ANTHROPIC_MODEL="moonshotai/kimi-k2.5"
export ANTHROPIC_SMALL_FAST_MODEL="moonshotai/kimi-k2.5"
# Start a session in your project directory
cd ~/my-project
claude .
完整設定指南:Novita AI Claude Code 整合
Cursor
最適合: 多檔案編輯、具程式碼庫感知的上下文、基於 GUI 的開發,以及希望在熟悉的 VS Code 中加入 AI 超級能力的開發者。
Cursor 是專為 AI 原生開發打造的 VS Code 分支。整合步驟:
- 從 cursor.sh 下載 Cursor
- 開啟 設定 → 模型
- 取消勾選預設模型
- 加入自訂模型:
- 提供者: 相容 OpenAI
- Base URL:
https://api.novita.ai/v3/openai - API 金鑰: 您的 Novita API 金鑰
- 模型名稱:
moonshotai/kimi-k2.5
- 使用 Cmd+K(行內編輯)、Cmd+L(聊天)或 Composer(多檔案)功能
完整設定指南:Novita AI Cursor 整合
NovitaClaw CLI
先決條件
- 已安裝 Python
- 一組 Novita API 金鑰 —— 以下是取得方式:
如何安裝 Python
Windows
- 下載 Python 安裝程式
- 執行安裝程式 —— 在點擊任何其他東西之前勾選「Add Python to PATH」。跳過此步驟是初學者之後遇到錯誤最常見的原因。
- 點擊 Install Now 並等待出現「Setup was successful」訊息
macOS
開啟終端機(Command + Space,搜尋「Terminal」)並執行:
python3 --version
如果您看到 Python 3.10 或更高版本,即可繼續。如果版本較舊,或終端機提示您安裝 Command Line Developer Tools,請點擊 Install 並等待幾分鐘後再繼續。
Linux (Ubuntu / Debian)
如果您使用的是基於 Debian 的發行版,請執行:
sudo apt update && sudo apt install python3 python3-pip -y
步驟 1:安裝 NovitaClaw
macOS / Linux:
sudo pip3 install novitaclaw
Windows PowerShell:
pip install novitaclaw
如果您已安裝舊版本,請升級到最新版本:
Bash
pip3 install novitaclaw --upgrade
如果升級失敗,請嘗試強制重新安裝:
Bash
pip3 install novitaclaw --upgrade --force-reinstall
安裝後,輸入 novitaclaw --help 進行驗證。如果您看到一列指令,表示安裝成功!

Mac 使用者的特別注意事項
如果安裝後出現 zsh: command not found: novitaclaw 錯誤,請依序執行以下兩個指令來修正您的環境路徑:
source ~/.zshrc
echo 'export PATH="'$(python3 -m site --user-base)'/bin:$PATH"' >> ~/.zshrc
macOS / Linux:
export NOVITA_API_KEY=sk_your_api_key
Windows PowerShell:
$env:NOVITA_API_KEY = "sk_your_api_key"
步驟 3:啟動實例
novitaclaw launch
成功後,CLI 會回傳三個您將用來存取和管理代理程式的值:
- Web UI URL
- Gateway WebSocket URL & Token
- Web Terminal URL(用於終端機存取沙箱)
- File Manager URL(用於瀏覽和管理工作區檔案)
- 登入憑證(適用於 Web Terminal 與 File Manager)

開啟回傳的 Web UI URL 並前往 Chat 標籤頁使用您的代理程式。使用 Web Terminal 網址在沙箱內開啟終端機工作階段,使用 File Manager 網址瀏覽和管理沙箱工作區中的檔案。
完整設定指南:NovitaClaw 整合
存取方式四:本地部署
自行架設需要顯著的基礎設施。Kimi K2.5 是一個總計 1 兆參數的混合專家模型,其中 32B 為活躍參數。
VRAM 需求
根據 Unsloth 的 GGUF 量化資料:
| 量化等級 | 檔案大小 | 品質影響 |
|---|---|---|
| Q2_K | 373.8 GB | 顯著品質損失 |
| Q4_K_M | 621.2 GB | 適度品質損失,可接受測試 |
| Q6_K | 842.9 GB | 最小品質損失 |
| BF16 | 2053.2 GB | 完整精確度 |
存取方式比較
| 方式 | 設定時間 | 成本 | 最適合 |
|---|---|---|---|
| 網頁遊樂場 | 30 秒 | 免費(有限制) | 快速評估、Agent Swarm 測試、非生產原型 |
| Novita AI API | 5 分鐘 | 每 100 萬 Token $0.60/$3.00 | 生產應用、可變工作負載、成本敏感專案 |
| 程式碼工具 | 10-15 分鐘 | 免費 + API 成本 | 希望為代理工作流程整合 IDE/終端機的開發者 |
| 本地部署 | 數天 | $5,000-15,000 硬體 + 電力 | 每月處理 20 億 Token 以上、有嚴格資料主權要求的企業 |
Kimi K2.5 的四種存取途徑適用於不同的部署場景。透過網頁遊樂場探索功能 → 使用 Novita API 建構應用程式 → 整合程式碼工具進行開發工作流程。僅在您有企業級工作負載和嚴格的資料主權要求時,才考慮自行架設。
結論
Kimi K2.5 提供四種彈性的存取路徑,以適應任何工作流程。從零設定的網頁遊樂場開始評估,接著使用 Novita AI API 進行生產級整合(每 100 萬個輸入 Token 僅需 $0.60),然後整合到 Claude Code 或 Cursor 以進行 AI 輔助開發,或自行架設以獲得完整的資料控制權。對大多數開發者而言,API 途徑在效能、成本和可靠性之間提供了最佳平衡,無需基礎設施負擔。
重點提示: 選擇 Novita AI API 以最快進入生產環境 —— 相容 OpenAI 的端點、無需管理 GPU,且價格具有競爭力。立即在 Novita AI 上開始使用 Kimi K2.5。
常見問題
Kimi K2.5 API 存取費用是多少?
Novita AI 收費為每 100 萬個輸入 Token $0.60,每 100 萬個輸出 Token $3.00 —— 對於同等推理任務,比 Claude Opus 4.5 便宜 76%。
Agent Swarm 模式可以透過 API 使用嗎?
不行。Agent Swarm(100 個代理的平行協調)目前需要僅在 kimi.com 上提供的自訂系統提示詞。標準 API 端點提供基礎功能;要複製 Agent Swarm 的行為需要提示詞工程。
我該自行架設 Kimi K2.5 還是使用 API?
自行架設需要顯著的基礎設施。Kimi K2.5 是一個總計 1 兆參數的混合專家模型,其中 32B 為活躍參數。在最少的量化等級(Q2_K)下,您需要約 374GB 儲存空間和多張高階 GPU。對大多數開發者而言,Novita AI API 存取可在每 100 萬個輸入 Token $0.60 的價格下提供相同功能,無需管理 GPU 叢集。僅在您有企業級工作負載和嚴格的資料主權要求時,才考慮自行架設。
Novita AI 是一個 AI 與代理雲端平台,協助開發者與新創公司以高效能、高可靠性與成本效率來建構、部署及擴展模型與代理應用程式。
推薦閱讀
