Kimi K2.7 Code 已在 Novita AI 上線,模型 ID 為 moonshotai/kimi-k2.7-code,提供相容 OpenAI 的 chat/completions 端點、262,144 token 的上下文視窗,並支援文字、圖片與影片輸入。本快速指南涵蓋開發者設定:驗證身份、發送第一個請求、使用視覺輸入、加入函式呼叫,以及在開發前了解定價。若想更全面了解定位與使用場景,請參閱 Kimi K2.7 Code on Novita AI 概覽。
Kimi K2.7 Code API 設定
首先準備三項設定:
| 項目 | 值 |
|---|---|
| API 金鑰 | 建立並儲存 Novita AI API 金鑰,設為環境變數如 NOVITA_API_KEY。 |
| 相容 OpenAI 的基礎 URL | https://api.novita.ai/openai |
| Chat completions 端點 | POST https://api.novita.ai/openai/v1/chat/completions |
| 模型 ID | moonshotai/kimi-k2.7-code |
Novita AI 文件索引 列出了相容 OpenAI 的基礎 URL,chat completions API 參考 則記載了完整的請求和回應欄位。
請勿將 API 金鑰寫入版本控制。在本機開發時,在 shell 中匯出:
export NOVITA_API_KEY="your_api_key"
若你的應用程式已使用 OpenAI SDK,只需進行最小改動:將基礎 URL 指向 Novita AI,並將模型設為 moonshotai/kimi-k2.7-code。
Kimi K2.7 Code 定價與限制
在程式碼中使用確切的模型 ID。在使用者介面中,則使用顯示名稱「Kimi K2.7 Code」。
| 欄位 | Novita 目前資料 |
|---|---|
| 顯示名稱 | Kimi K2.7 Code |
| API 模型 ID | moonshotai/kimi-k2.7-code |
| 模型系列 | MoonshotAI |
| 架構 | MoE,總參數 1T,啟用參數 32B |
| 端點系列 | chat/completions、anthropic |
| 輸入模態 | 文字、圖片、影片 |
| 輸出模態 | 文字 |
| 上下文視窗 | 262,144 tokens |
| 最大輸出 tokens | 262,144 tokens |
| 功能 | 函式呼叫、結構化輸出、推理 |
截至 2026 年 6 月 16 日,Novita 為 moonshotai/kimi-k2.7-code 列出以下 token 定價:
| Token 類型 | 列示價格 |
|---|---|
| 輸入 tokens | 每 1M tokens $0.95 美元 |
| 輸出 tokens | 每 1M tokens $4.00 美元 |
| 快取讀取輸入 tokens | 每 1M tokens $0.19 美元 |
定價、可用性與速率限制可能變更。在投入生產環境或承諾任何成本之前,請查閱 Kimi K2.7 Code 模型頁面 與 Novita AI 定價頁面。
Kimi K2.7 Code cURL 範例
先以純文字請求開始,確認驗證、模型路由與回應解析都正常,再加入視覺或工具呼叫。
curl "https://api.novita.ai/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer ${NOVITA_API_KEY}" \
-d '{
"model": "moonshotai/kimi-k2.7-code",
"messages": [
{
"role": "system",
"content": "You are a concise code review assistant."
},
{
"role": "user",
"content": "List three common mistakes when implementing retry logic in Python."
}
],
"max_tokens": 512,
"temperature": 0.2
}'
成功的回應會傳回標準的 chat completions 結構:一個 choices 陣列、含有 content 的訊息、model/created 後設資料,以及一個包含 prompt、completion 與 total token 計數的 usage 物件。
使用這個快速測試來驗證:
- API 金鑰有效,且授權標頭格式正確。
- 模型 ID 被接受,沒有傳回 404 或模型未找到錯誤。
- 你的客戶端能正確解析
choices[0].message.content。 - Token 用量已記錄,以便從第一個請求開始監控成本。
Kimi K2.7 Code Python 範例
OpenAI Python SDK 在設定 Novita 基礎 URL 後即可搭配 Novita AI 使用。請根據自身的依賴管理政策鎖定 SDK 版本。
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "You are a concise code review assistant."},
{
"role": "user",
"content": "Review this Python function for off-by-one errors and missing edge cases:\n\ndef get_items(lst, start, end):\n return lst[start:end]",
},
],
max_tokens=512,
temperature=0.2,
)
print(response.choices[0].message.content)
print("Tokens used:", response.usage.total_tokens)
對於長時間的編碼代理(coding agent)會話,請明確設定 max_tokens。Kimi K2.7 Code 支援最多 262,144 個輸出 tokens,但生產環境中的代理應為每個回合預算 token 用量,並在多次執行中監控累積成本。
圖片與影片輸入
Novita 將文字、圖片與影片列為 Kimi K2.7 Code 的輸入模態。若要使用視覺輸入,請在使用者訊息的 content 陣列中傳遞一個 text 部分與一個 image_url 部分:
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "You are a UI code review assistant."},
{
"role": "user",
"content": [
{
"type": "text",
"text": "Describe any accessibility issues visible in this UI screenshot and suggest CSS fixes.",
},
{
"type": "image_url",
"image_url": {"url": "https://example.com/screenshot.png"},
},
],
},
],
max_tokens=512,
)
print(response.choices[0].message.content)
多模態整合的實務順序:
- 先確認純文字快速測試可正常運作。
- 加入一個圖片輸入,並指定一個可清楚驗證的任務,例如從 UI 截圖中提取標籤。
- 針對實際工作負載,驗證回應品質與回應結構是否正確。
- 分別測試影片輸入——先從短片開始,確認請求格式,並測量延遲與 token 成本,再將影片納入生產路徑。
請不要假設每一個相容 OpenAI 的多模態 payload 都能被 Novita 代管的所有模型以完全相同的方式接受。在正式推出前,請確認 moonshotai/kimi-k2.7-code 的圖片與影片 payload 格式,請參考最新的 Novita AI 文件 或主控台範例。
函式呼叫與結構化輸出
Kimi K2.7 Code 透過 tools 參數支援函式呼叫,並透過 response_format 支援結構化輸出。Novita AI 模型頁面已將這兩項列為支援功能。
當模型應選擇工具並傳回結構化引數,而非以散文方式回答時,請使用函式呼叫:
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key=os.environ["NOVITA_API_KEY"],
)
tools = [
{
"type": "function",
"function": {
"name": "file_search",
"description": "Search the repository for files matching a pattern.",
"parameters": {
"type": "object",
"properties": {
"pattern": {
"type": "string",
"description": "Glob pattern to match, e.g. '**/*.py'",
},
"directory": {
"type": "string",
"description": "Root directory to search within.",
},
},
"required": ["pattern"],
},
},
}
]
response = client.chat.completions.create(
model="moonshotai/kimi-k2.7-code",
messages=[
{"role": "system", "content": "You are a repository analysis assistant."},
{
"role": "user",
"content": "Find all Python files in the src directory that might contain database migration logic.",
},
],
tools=tools,
tool_choice="auto",
temperature=0.1,
)
message = response.choices[0].message
if message.tool_calls:
for call in message.tool_calls:
print(f"Tool: {call.function.name}")
print(f"Arguments: {call.function.arguments}")
else:
print(message.content)
對於結構化輸出,當你需要在無需工具呼叫的情況下取得經過驗證的 JSON 回應時,請使用搭配 json_schema 的 response_format。初期請保持 schema 簡潔,並測試你的解析器是否能處理 moonshotai/kimi-k2.7-code 傳回的確切回應結構,之後再在生產環境中依賴嚴格模式。
Kimi K2.7 Code 的交錯思考架構(interleaved thinking)意味著它會在回傳結果之前先進行多步驟推理。對於每個回合需多次工具呼叫的代理編碼工作流程,請先針對實際任務集測試工具選擇、引數品質與回應延遲的表現,然後再將生產流量導向此模型。
生產測試檢查清單
Kimi K2.7 Code 分別針對輸入、輸出與快取讀取 tokens 計價。成本概況會因工作負載而有顯著差異:
- 長上下文程式碼審查:大量輸入 tokens 佔據主要成本。
- 程式碼生成代理:輸出 token 用量會隨回應長度與回合數增加。
- 重複上下文工作流程:當穩定的系統提示、工具 schema 或範本庫在多次呼叫中重複出現時,快取讀取定價適用。
在投入生產環境前,請執行包含以下項目的評估集:
- 簡短純文字提示(延遲基準與驗證檢查)。
- 接近預期工作大小(而非最大視窗)的長上下文提示。
- 工具呼叫提示,其中正確行為是呼叫函式並傳遞有效引數。
- 與實際上傳來源和檔案處理相符的圖片輸入。
- 失敗情況:超長輸入、遺失媒體 URL、無效 API 金鑰與逾時行為。
功能清單說明哪些功能可用。但實際工作負載的評估才能告訴你延遲、token 用量、工具引數品質與輸出正確性是否達到生產標準。
常見問題
Kimi K2.7 Code 是否可透過 Novita AI 使用?
可以。Novita AI 將 Kimi K2.7 Code 列為 Serverless LLM,API 模型 ID 為 moonshotai/kimi-k2.7-code。
正確的模型 ID 是什麼?
在所有 API 呼叫中使用 moonshotai/kimi-k2.7-code。
應該使用哪個端點?
請使用相容 OpenAI 的 chat completions 端點:POST https://api.novita.ai/openai/v1/chat/completions。若使用 OpenAI SDK 客戶端,請將基礎 URL 設為 https://api.novita.ai/openai。
Kimi K2.7 Code 的費用是多少?
截至 2026 年 6 月 16 日,Novita AI 列出價格為:每 1M 輸入 tokens $0.95 美元、每 1M 輸出 tokens $4.00 美元、每 1M 快取讀取輸入 tokens $0.19 美元。在任何採購決策前,請至 Kimi K2.7 Code 模型頁面 確認最新價格。
是否支援圖片與影片輸入?
Novita 將文字、圖片與影片列為輸入模態。關於確切的 payload 格式,請在推出多模態功能前,以最新的 Novita 文件或測試呼叫進行驗證。
Kimi K2.7 Code 是否支援函式呼叫?
支援。請在 chat completions 請求中使用 tools 參數。Novita 已將函式呼叫與結構化輸出列為支援的功能。
上下文視窗是多少?
根據 Novita AI 模型頁面,為 262,144 tokens 的上下文視窗與 262,144 tokens 的最大輸出。
