如何存取 Kimi K2.5:網頁、API、Claude Code、自行部屬

如何存取 Kimi K2.5:網頁、API、Claude Code、自行部屬

存取最先進的 AI 模型不應該需要數週的基礎設施設定。Kimi K2.5 提供四種使用途徑:網頁遊樂場(零設定)、Novita AI API(3 行程式碼)、程式碼工具整合(Claude Code、Cursor、Continue),以及本地部署(375GB 以上的基礎設施)。

本指南涵蓋所有存取方式——從最簡單到最高階——設定時間從約 30 秒(網頁存取)到數天(自行架設)不等。API 存取定價為每 100 萬個 Token $0.60 / $3.00,提供生產級效能,無需管理 GPU 叢集的營運負擔。

Kimi K2.5 模型介紹

Kimi K2.5 的新功能

Kimi K2.5 引入了 Agent Swarm 模式,可協調多達 100 個專門的子代理同時執行工作流程。透過動態生成代理來處理並行任務,相較於循序處理,執行速度快了 4.5 倍。該模型還能維持在 200–300 次連續工具呼叫期間的穩定效能而不產生偏差,解決了許多模型在長時間代理對話中失去連貫性的常見失敗點。

來自 Kimi

核心規格

開發者 Moonshot AI
參數量 總計 1 兆,活躍參數 32B(MoE 架構)
上下文視窗 256K 個 Token
模態 文字、視覺
操作模式 即時(3-8 秒)、思考(推理軌跡)、代理(搜尋/程式碼/網頁)、Agent Swarm(平行協調)

基準測試表現

整體而言,Kimi K2.5 在以下領域表現特別出色:

  • 代理搜尋與自主研究
  • 數學推理
  • 基於文件/OCR 的視覺任務
  • 長影片多模態理解
類別 基準測試 Kimi K2.5 GPT-5.2
推理 HLE-Full 30.1 34.5
HLE-Full(搭配工具) 50.2 45.5
AIME 2025 96.1 100
HMMT 2025 95.4 99.4
IMO-AnswerBench 81.8 86.3
GPQA-Diamond 87.6 92.4
MMLU-Pro 87.1 86.7
視覺 / 多模態 MMMU-Pro 78.5 79.5
MathVision 84.2 83.0
MathVista 90.1 82.8
OCRBench 92.3 80.7
InfoVQA 92.6 84.0
SimpleVQA 71.2 55.8
影片理解 VideoMMMU 86.6 85.9
MotionBench 70.4 64.8
LongVideoBench 79.8 76.5
程式碼 SWE-Bench Verified 76.8 80.0
SWE-Bench Pro 50.7 55.6
TerminalBench 50.8 54.0
LiveCodeBench 85.0
代理搜尋 BrowseComp 60.6 65.8
BrowseComp (Agent Swarm) 78.4
DeepSearchQA 77.1 71.3

立即試用 Kimi K2.5!

存取方式一:Novita AI 遊樂場

Novita 的遊樂場提供一種無需設定負擔的直覺方式來探索和使用 Kimi K2.5。您可以直接在聊天或補全介面中與模型互動,即時調整溫度(temperature)和最大 Token 數(max tokens)等參數,並立即觀察輸出的變化。這讓您能夠在整合到應用程式之前,先行測試提示詞、優化系統指令以及評估回應品質。

在免費遊樂場中試用 Kimi K2.5。

立即試用 Kimi K2.5!

存取方式二:Novita AI API 存取(適用開發者)

提供生產級程式化存取,相容 OpenAI 端點。 Novita AI 提供 Kimi K2.5 的即時 API 存取,輸入價格為每 100 萬個 Token $0.60,輸出價格為每 100 萬個 Token $3.00 —— 對於同等推理任務,比 Claude Opus 4.5 便宜 76%。其相容 OpenAI 的端點意味著您現有的程式碼僅需兩項設定變更:base URL 和 API 金鑰。

立即試用 Kimi K2.5!

取得您的 API 金鑰

  1. novita.ai 建立帳戶
  2. 前往金鑰管理頁面
  3. 產生新的 API 金鑰(請妥善保管 —— 像對待密碼一樣)

透過 API 整合

安裝 OpenAI SDK 並連接到 Novita 的端點:

pip install openai
from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=262144,
    temperature=0.7
)

print(response.choices[0].message.content)

存取方式三:程式碼工具整合

將 Kimi K2.5 整合到您的開發環境中,以實現代理式編碼工作流程。這些工具提供終端機自動化、IDE 整合以及多步驟任務執行能力,利用了 Kimi 擴展的工具呼叫穩定性。

透過官方整合和逐步指南,輕鬆將 Novita AI 與合作平台(如 TraeContinueCodexOpenCodeAnythingLLMLangChainDifyLangflowOpenclaw)串接起來。

Claude Code

最適合: 基於終端機的工作流程、Git 操作、檔案系統任務,以及偏好使用鍵盤驅動開發的開發者。

Claude Code 是 Anthropic 的官方 CLI 代理。雖然專為 Claude 模型設計,但它透過環境變數支援自訂模型端點。設定只需 2 分鐘:

# Install Claude Code
npm install -g @anthropic-ai/claude-code

# Configure for Kimi K2.5 via Novita
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="YOUR_NOVITA_API_KEY"
export ANTHROPIC_MODEL="moonshotai/kimi-k2.5"
export ANTHROPIC_SMALL_FAST_MODEL="moonshotai/kimi-k2.5"

# Start a session in your project directory
cd ~/my-project
claude .

完整設定指南:Novita AI Claude Code 整合

Cursor

最適合: 多檔案編輯、具程式碼庫感知的上下文、基於 GUI 的開發,以及希望在熟悉的 VS Code 中加入 AI 超級能力的開發者。

Cursor 是專為 AI 原生開發打造的 VS Code 分支。整合步驟:

  1. cursor.sh 下載 Cursor
  2. 開啟 設定模型
  3. 取消勾選預設模型
  4. 加入自訂模型:
    • 提供者: 相容 OpenAI
    • Base URL: https://api.novita.ai/v3/openai
    • API 金鑰: 您的 Novita API 金鑰
    • 模型名稱: moonshotai/kimi-k2.5
  5. 使用 Cmd+K(行內編輯)、Cmd+L(聊天)或 Composer(多檔案)功能

完整設定指南:Novita AI Cursor 整合

NovitaClaw CLI

先決條件

  • 已安裝 Python
  • 一組 Novita API 金鑰 —— 以下是取得方式:
    • 登入 novita.ai —— 使用 Google 或 GitHub 登入(首次登入時會自動建立新帳戶),或使用電子郵件註冊
    • 建立 API 金鑰 —— 前往金鑰管理設定頁面建立或管理您的 API 金鑰。將其複製到安全的地方 —— 下一步會用到。
如何安裝 Python

Windows

  1. 下載 Python 安裝程式
  2. 執行安裝程式 —— 在點擊任何其他東西之前勾選「Add Python to PATH」。跳過此步驟是初學者之後遇到錯誤最常見的原因。
  3. 點擊 Install Now 並等待出現「Setup was successful」訊息
macOS

開啟終端機(Command + Space,搜尋「Terminal」)並執行:

python3 --version

如果您看到 Python 3.10 或更高版本,即可繼續。如果版本較舊,或終端機提示您安裝 Command Line Developer Tools,請點擊 Install 並等待幾分鐘後再繼續。

Linux (Ubuntu / Debian)

如果您使用的是基於 Debian 的發行版,請執行:

sudo apt update && sudo apt install python3 python3-pip -y
#### 安裝與啟動

步驟 1:安裝 NovitaClaw

macOS / Linux:

sudo pip3 install novitaclaw

Windows PowerShell:

pip install novitaclaw

如果您已安裝舊版本,請升級到最新版本:

Bash

pip3 install novitaclaw --upgrade

如果升級失敗,請嘗試強制重新安裝:

Bash

pip3 install novitaclaw --upgrade --force-reinstall

安裝後,輸入 novitaclaw --help 進行驗證。如果您看到一列指令,表示安裝成功!

novitaclaw --help

Mac 使用者的特別注意事項

如果安裝後出現 zsh: command not found: novitaclaw 錯誤,請依序執行以下兩個指令來修正您的環境路徑:

source ~/.zshrc

echo 'export PATH="'$(python3 -m site --user-base)'/bin:$PATH"' >> ~/.zshrc

#### 步驟 2:在終端機中設定環境變數

macOS / Linux:

export NOVITA_API_KEY=sk_your_api_key

Windows PowerShell:

$env:NOVITA_API_KEY = "sk_your_api_key"

步驟 3:啟動實例

novitaclaw launch

成功後,CLI 會回傳三個您將用來存取和管理代理程式的值:

  • Web UI URL
  • Gateway WebSocket URL & Token
  • Web Terminal URL(用於終端機存取沙箱)
  • File Manager URL(用於瀏覽和管理工作區檔案)
  • 登入憑證(適用於 Web Terminal 與 File Manager)

openclaw 截圖

開啟回傳的 Web UI URL 並前往 Chat 標籤頁使用您的代理程式。使用 Web Terminal 網址在沙箱內開啟終端機工作階段,使用 File Manager 網址瀏覽和管理沙箱工作區中的檔案。

完整設定指南:NovitaClaw 整合

存取方式四:本地部署

自行架設需要顯著的基礎設施。Kimi K2.5 是一個總計 1 兆參數的混合專家模型,其中 32B 為活躍參數。

VRAM 需求

根據 Unsloth 的 GGUF 量化資料:

量化等級 檔案大小 品質影響
Q2_K 373.8 GB 顯著品質損失
Q4_K_M 621.2 GB 適度品質損失,可接受測試
Q6_K 842.9 GB 最小品質損失
BF16 2053.2 GB 完整精確度

存取方式比較

方式 設定時間 成本 最適合
網頁遊樂場 30 秒 免費(有限制) 快速評估、Agent Swarm 測試、非生產原型
Novita AI API 5 分鐘 每 100 萬 Token $0.60/$3.00 生產應用、可變工作負載、成本敏感專案
程式碼工具 10-15 分鐘 免費 + API 成本 希望為代理工作流程整合 IDE/終端機的開發者
本地部署 數天 $5,000-15,000 硬體 + 電力 每月處理 20 億 Token 以上、有嚴格資料主權要求的企業

Kimi K2.5 的四種存取途徑適用於不同的部署場景。透過網頁遊樂場探索功能 → 使用 Novita API 建構應用程式 → 整合程式碼工具進行開發工作流程。僅在您有企業級工作負載和嚴格的資料主權要求時,才考慮自行架設。

結論

Kimi K2.5 提供四種彈性的存取路徑,以適應任何工作流程。從零設定的網頁遊樂場開始評估,接著使用 Novita AI API 進行生產級整合(每 100 萬個輸入 Token 僅需 $0.60),然後整合到 Claude Code 或 Cursor 以進行 AI 輔助開發,或自行架設以獲得完整的資料控制權。對大多數開發者而言,API 途徑在效能、成本和可靠性之間提供了最佳平衡,無需基礎設施負擔。

重點提示: 選擇 Novita AI API 以最快進入生產環境 —— 相容 OpenAI 的端點、無需管理 GPU,且價格具有競爭力。立即在 Novita AI 上開始使用 Kimi K2.5

常見問題

Kimi K2.5 API 存取費用是多少?

Novita AI 收費為每 100 萬個輸入 Token $0.60,每 100 萬個輸出 Token $3.00 —— 對於同等推理任務,比 Claude Opus 4.5 便宜 76%。

Agent Swarm 模式可以透過 API 使用嗎?

不行。Agent Swarm(100 個代理的平行協調)目前需要僅在 kimi.com 上提供的自訂系統提示詞。標準 API 端點提供基礎功能;要複製 Agent Swarm 的行為需要提示詞工程。

我該自行架設 Kimi K2.5 還是使用 API?

自行架設需要顯著的基礎設施。Kimi K2.5 是一個總計 1 兆參數的混合專家模型,其中 32B 為活躍參數。在最少的量化等級(Q2_K)下,您需要約 374GB 儲存空間和多張高階 GPU。對大多數開發者而言,Novita AI API 存取可在每 100 萬個輸入 Token $0.60 的價格下提供相同功能,無需管理 GPU 叢集。僅在您有企業級工作負載和嚴格的資料主權要求時,才考慮自行架設。

Novita AI 是一個 AI 與代理雲端平台,協助開發者與新創公司以高效能、高可靠性與成本效率來建構、部署及擴展模型與代理應用程式。

推薦閱讀