Kimi K2-Instruct-0905:新一代智能体AI现已登陆Novita AI

Kimi K2-Instruct-0905:新一代智能体AI现已登陆Novita AI

Kimi K2-Instruct-0905是Moonshot AI推出的最新迭代产品,在智能体智能和编程能力方面实现了突破性进展。这款顶尖的混合专家(MoE)语言模型现已登陆Novita AI,为全球开发者带来1万亿总参数量、320亿激活参数量以及扩展至256000 token的上下文窗口。该模型支持Claude Code集成,开发者可直接在终端工作流中调用其先进的智能体编程能力。

Kimi K2-Instruct-0905在Novita AI上的当前定价: 每百万输入token 0.6美元,每百万输出token 2.5美元

什么是Kimi K2-Instruct-0905?

Kimi K2-Instruct-0905是Kimi 2系列最新、能力最强的版本,是一款顶尖的混合专家(MoE)语言模型,拥有320亿激活参数量,总参数量达1万亿。

增强的智能体编程智能

Kimi K2-Instruct-0905在公开基准测试和真实世界编程智能体任务上的性能均有显著提升。

优化的前端编程体验

Kimi K2-Instruct-0905在前端编程的美观性和实用性方面均实现了技术突破。

扩展的上下文长度

Kimi K2-Instruct-0905的上下文窗口从128k token扩展至256k token,能够更好地支持长周期任务。

技术架构与规格参数

Kimi K2-Instruct-0905代表了混合专家架构的最前沿工程技术:

规格参数 数值
架构 混合专家(MoE)
总参数量 1万亿
激活参数量 320亿
上下文长度 256000 token
层数 61(含1个密集层)
注意力机制 MLA(多头潜在注意力)
专家数量 384
每个token选中的专家数 8
词表大小 160000
激活函数 SwiGLU

这套先进的架构通过智能专家选择机制,在保持万亿参数模型全部能力的同时,实现了高效的计算处理。

基准测试表现:行业领先

Kimi K2-Instruct-0905在关键评估指标上表现卓越,尤其在编程和智能体任务领域:

编程能力卓越

基准测试 指标 K2-Instruct-0905 K2-Instruct-0711 Qwen3-Coder-480B-A35B-Instruct GLM-4.5 DeepSeek-V3.1 Claude-Sonnet-4 Claude-Opus-4
SWE-Bench verified ACC 69.2 ± 0.63 65.8 69.6* 64.2* 66.0* 72.7* 72.5*
SWE-Bench Multilingual ACC 55.9 ± 0.72 47.3 54.7* 52.7 54.5* 53.3* -
Multi-SWE-Bench ACC 33.5 ± 0.28 31.3 32.7 31.7 29.0 35.7 -
Terminal-Bench ACC 44.5 ± 2.03 37.5 37.5* 39.9* 31.3* 36.4* 43.2*
SWE-Dev ACC 66.6 ± 0.72 61.9 64.7 63.2 53.3 67.1 -

这些测试结果表明,Kimi K2-Instruct-0905是真实编程场景下的顶尖表现者,其表现往往能够比肩甚至超越Claude Sonnet 4、Claude Opus 4等主流领先模型。

如何在Novita AI上使用Kimi K2-Instruct-0905

方式一:交互式Playground

通过Novita AI的友好界面,即可立即体验Kimi K2-Instruct-0905:

  • 即时访问:无需任何配置即可使用
  • 支持函数调用:可直接在Playground中测试工具调用能力
  • 模型对比:可与其他主流模型进行对比测试
  • 实时实验:可快速迭代提示词和测试用例

立即体验Kimi-K2-Instruct-0905演示

方式二:API集成

将Kimi K2-Instruct-0905无缝集成到你的应用中:

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key="",
)

model = "moonshotai/kimi-k2-0905"
stream = True # or False
max_tokens = 131072
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

方式三:通过OpenAI Agents SDK构建多智能体工作流

通过将Novita AI与OpenAI Agents SDK集成,构建先进的多模态智能体系统:

方式四:在第三方平台接入Kimi K2-Instruct-0905 API

  • Hugging Face:通过Novita AI端点,可在Spaces、流水线或Transformers库中使用Kimi K2-Instruct-0905
  • 智能体与编排框架:通过官方连接器和分步集成指南,可轻松将Novita AI与ContinueAnythingLLMLangChainDifyLangflow等合作伙伴平台对接
  • OpenAI兼容API:可无缝迁移和集成符合OpenAI API标准的工具,如Cline、Trae、CursorQwen Code
  • Anthropic兼容API:可与Claude Code及其他Anthropic API兼容工具无缝集成,用于智能体编程工作流

使用场景与应用

自主编程智能体

  • 代码生成:补全函数、类和模块
  • 缺陷修复:识别并解决软件问题
  • 代码审查:自动化的代码质量评估
  • 文档生成:生成全面的代码文档

高级前端开发

  • 组件库开发:创建可复用的UI组件
  • 响应式设计:生成移动端优先的自适应布局
  • 框架迁移:在不同前端框架间转换代码
  • 性能优化:提出并实施性能优化方案

长上下文应用场景

  • 文档分析:处理并理解长篇技术文档
  • 代码库探索:浏览并理解大型软件项目
  • 多轮对话:在长交互过程中保持上下文连贯
  • 复杂推理:处理多步骤分析类任务

总结

Kimi K2-Instruct-0905代表了智能体AI技术的最前沿,将大规模参数与实用智能完美结合。其增强的编程能力、扩展的上下文窗口以及出色的工具调用能力,使其成为探索AI能力边界的开发者的理想选择。

该模型现已登陆Novita AI,在研究和生产应用中均能实现性能、易用性和成本效益的完美平衡。

立即在Novita AI上试用Kimi K2-Instruct-0905演示,体验智能体智能的未来!


Novita AI是领先的AI云平台,为开发者提供易用的API以及高性价比、可靠的GPU基础设施,用于构建和扩展AI应用。

常见问题