Kimi K2-Instruct-0905 是 Moonshot AI 的最新迭代產品,代表了代理式智能與編程能力的突破。這款最先進的混合專家(MoE)語言模型現已登陸 Novita AI,為全球開發者帶來 1 萬億總參數、320 億激活參數,以及擴展至 256,000 token 的上下文窗口。支援 Claude Code 整合,開發者可以直接在終端工作流程中利用其先進的代理式編程能力。
Kimi K2-Instruct-0905 在 Novita AI 上的目前定價: 每百萬輸入 token 0.6 美元,每百萬輸出 token 2.5 美元
什麼是 Kimi K2-Instruct-0905?
Kimi K2-Instruct-0905 是 Kimi K2 系列最新、能力最強版本。它是一款最先進的混合專家(MoE)語言模型,擁有 320 億激活參數,總參數量達 1 萬億。
強化代理式編程智能
Kimi K2-Instruct-0905 在公開基準測試和真實編程代理任務上的性能都有顯著提升。
優化前端編程體驗
Kimi K2-Instruct-0905 在前端編程的美觀度和實用性上都有進一步提升。
擴展上下文長度
Kimi K2-Instruct-0905 的上下文窗口從 128k 提升至 256k token,能更好地支援長時程任務。
技術架構與規格
Kimi K2-Instruct-0905 代表了混合專家架構的最前沿工程成果:
| 規格 | 數值 |
|---|---|
| 架構 | 混合專家(MoE) |
| 總參數量 | 1 萬億 |
| 激活參數量 | 320 億 |
| 上下文長度 | 256,000 token |
| 層數 | 61 層(包含 1 層密集層) |
| 注意力機制 | MLA(多頭潛在注意力) |
| 專家數量 | 384 |
| 每 token 選擇的專家數 | 8 |
| 詞表大小 | 160,000 |
| 激活函數 | SwiGLU |
這套先進的架構透過智能專家選擇,在保持萬億參數量模型完整能力的同時,實現了高效的運算效率。
基準測試表現:業界領先
Kimi K2-Instruct-0905 在關鍵評估指標上表現卓越,尤其在編程和代理式任務上:
編程表現卓越
| 基準測試 | 指標 | K2-Instruct-0905 | K2-Instruct-0711 | Qwen3-Coder-480B-A35B-Instruct | GLM-4.5 | DeepSeek-V3.1 | Claude-Sonnet-4 | Claude-Opus-4 |
|---|---|---|---|---|---|---|---|---|
| SWE-Bench verified | ACC | 69.2 ± 0.63 | 65.8 | 69.6* | 64.2* | 66.0* | 72.7* | 72.5* |
| SWE-Bench Multilingual | ACC | 55.9 ± 0.72 | 47.3 | 54.7* | 52.7 | 54.5* | 53.3* | - |
| Multi-SWE-Bench | ACC | 33.5 ± 0.28 | 31.3 | 32.7 | 31.7 | 29.0 | 35.7 | - |
| Terminal-Bench | ACC | 44.5 ± 2.03 | 37.5 | 37.5* | 39.9* | 31.3* | 36.4* | 43.2* |
| SWE-Dev | ACC | 66.6 ± 0.72 | 61.9 | 64.7 | 63.2 | 53.3 | 67.1 | - |
這些結果讓 Kimi K2-Instruct-0905 成為真實編程場景中的頂尖表現者,表現往往能比肩甚至超越 Claude Sonnet 4、Claude Opus 4 等領先模型。
如何在 Novita AI 上使用 Kimi K2-Instruct-0905
選項 1:互動式測試平台
您可以透過 Novita AI 使用者友好的介面立即體驗 Kimi K2-Instruct-0905:
- 即時存取:無需任何設定
- 函數呼叫支援:直接在測試平台測試工具呼叫能力
- 模型對比:可與其他領先模型進行對比測試
- 即時實驗:快速迭代提示詞與使用場景
選項 2:API 整合
您可以將 Kimi K2-Instruct-0905 無縫整合到您的應用程式中:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="",
)
model = "moonshotai/kimi-k2-0905"
stream = True # or False
max_tokens = 131072
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
選項 3:透過 OpenAI Agents SDK 構建多代理工作流
透過整合 Novita AI 與 OpenAI Agents SDK 構建先進的多模態代理系統:
- 即插即用:可在任何 OpenAI Agents 工作流中使用 Kimi K2-Instruct-0905
- 支援交接、路由與工具使用:可設計能分析視覺內容、委派任務或執行函數的代理
- Python 整合:只需將 SDK 指向 Novita 的端點(https://api.novita.ai/v3/openai),並使用您的 API 金鑰,即可實現無縫代理工作流
選項 4:在第三方平台連接 Kimi K2-Instruct-0905 API
- Hugging Face:可透過 Novita AI 端點,在 Spaces、管線中或搭配 Transformers 函式庫使用 Kimi K2-Instruct-0905
- 代理與編排框架:可透過官方連接器和逐步整合指南,輕鬆將 Novita AI 與合作夥伴平台如 Continue、AnythingLLM、LangChain、Dify 和 Langflow 連接
- OpenAI 相容 API:可無縫遷移並整合至 Cline、Trae、Cursor、Qwen Code 等工具,這些工具皆設計為符合 OpenAI API 標準
- Anthropic 相容 API:可無縫整合至 Claude Code,用於代理式編程工作流及其他符合 Anthropic API 標準的工具
使用場景與應用
自主編程代理
- 程式碼生成:完成函數、類別與模組
- 錯誤修復:識別並解決軟體問題
- 程式碼審查:自動化程式碼品質評估
- 文件生成:生成完整的程式碼文件
進階前端開發
- 組件庫:建立可重複使用的 UI 組件
- 響應式設計:生成的行動優先、自適應佈局
- 框架遷移:在不同前端框架之間轉換程式碼
- 效能優化:建議並實施效能改進方案
長上下文應用場景
- 文件分析:處理和理解長篇技術文件
- 程式碼庫探索:瀏覽和理解大型軟體專案
- 多輪對話:在長時間互動中維持上下文
- 複雜推理:處理多步驟分析任務
總結
Kimi K2-Instruct-0905 代表了代理式 AI 技術的最前沿,結合了大規模架構與實用智能。其強化的編程能力、擴展的上下文窗口以及優異的工具呼叫能力,使其成為開發者突破 AI 能力邊界的理想選擇。
現已於 Novita AI 上線,這款模型在效能、可存取性與成本效益之間取得了完美平衡,適用於研究和生產場景。
立即在 Novita AI 上體驗 Kimi K2-Instruct-0905 演示,感受代理式智能的未來!
Novita AI 是領先的 AI 雲端平台,為開發者提供易於使用的 API 與實惠、可靠的 GPU 基礎設施,用於構建和擴展 AI 應用程式。
