English Arabic 简体中文 繁體中文 Français Deutsch 日本語 한국어 Português Русский Español

Kimi K2.7 Code 上线 Novita AI:智能编程 API

Kimi K2.7 Code 上线 Novita AI:智能编程 API

Kimi K2.7 Code 现已登陆 Novita AI,面向构建编程智能体、工具调用助手、长上下文工程工作流的开发者开放。Novita AI 模型页面显示,moonshotai/kimi-k2.7-code 是一个聊天模型,支持 OpenAI 兼容的 chat/completions 访问、Anthropic 兼容访问,拥有 262,144 token 的上下文窗口,支持多模态输入,定价为每 1M 输入 token 0.95 美元、每 1M 缓存读取 token 0.19 美元、每 1M 输出 token 4.00 美元,数据核查时间为 2026 年 6 月 13 日。

核心要点

  • Kimi K2.7 Code 是 MoonshotAI 推出的编程与智能体模型,可通过 Novita AI 上的 Kimi K2.7 Code API 和 Playground 获取。
  • 经核实的 Novita AI 模型 ID 为 moonshotai/kimi-k2.7-code,模型页面列出的端点家族包括 chat/completionsanthropic
  • 模型页面显示其拥有 262,144 token 的上下文窗口和 262,144 token 的最大输出长度,适用于长仓库上下文、多文件推理、长智能体轨迹等场景。
  • 2026 年 6 月 13 日核实的定价:每 1M 输入 token 0.95 美元,每 1M 缓存读取输入 token 0.19 美元,每 1M 输出 token 4.00 美元。

什么是 Kimi K2.7 Code?

Kimi K2.7 Code 是 MoonshotAI 推出的面向智能体软件开发工作流的编程专属 Kimi 模型。Novita AI 上的 Kimi K2.7 Code 模型页面 介绍其为总参数量 1T、激活参数量 32B 的混合专家(MoE)模型,拥有 256K 上下文窗口,支持交错思维和多步工具调用。

对开发者而言,重要的变化不止是模型名称。Kimi K2.7 Code 的定位是处理需要读取大上下文、推理多步实施计划、调用工具、通过 API 生成代码或结构化输出的任务,因此天然适合编程助手、感知仓库内容的智能体、代码审查 copilot、以及依赖上下文长度和工具使用行为的内部自动化场景。

模型页面还列明其输入模态为文本、图像、视频,输出模态为文本。实际应用中,该模型可用于评估视觉驱动的开发任务、UI 检查、设计转代码提示、多模态调试工作流,同时仍可通过聊天 API 输出文本响应。

在 Novita AI 上访问 Kimi K2.7 Code API

Kimi K2.7 Code 现已通过 Novita AI 上线,精确模型 ID 为 moonshotai/kimi-k2.7-code,模型页面列出的端点家族有两个:

端点家族 对开发者的意义 来源/核查日期
chat/completions 通过 OpenAI 兼容的聊天补全接口使用 Kimi K2.7 Code。 Novita AI 模型页面,2026 年 6 月 13 日
anthropic 通过 Novita AI 的 Anthropic 兼容端点路径使用该模型(需你的工具链支持)。 Novita AI 模型页面,2026 年 6 月 13 日

对大多数应用团队而言,OpenAI 兼容路径是最简单的入门选择。你只需沿用熟悉的聊天消息格式,配置 Novita AI 基础 URL,并将模型设置为 moonshotai/kimi-k2.7-code 即可。

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_NOVITA_API_KEY",
    base_url="https://api.novita.ai/v3/openai",
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "You are a careful coding assistant."},
        {"role": "user", "content": "Review this function for correctness and edge cases."},
    ],
    max_tokens=4096,
    temperature=0.2,
)

print(response.choices[0].message.content)

你可以通过 Novita AI 密钥管理 创建和管理 API 密钥。账户设置相关说明可参考 Novita AI 快速入门指南

Kimi K2.7 Code 规格与定价概览

字段 详情 来源/核查日期
显示名称 Kimi K2.7 Code Novita AI 模型页面,2026 年 6 月 13 日
模型 ID moonshotai/kimi-k2.7-code Novita AI 模型页面,2026 年 6 月 13 日
模型类型 聊天模型 Novita AI 模型页面,2026 年 6 月 13 日
系列 MoonshotAI Novita AI 模型页面,2026 年 6 月 13 日
架构标签 MoE Novita AI 模型页面,2026 年 6 月 13 日
参数量概览 总参数量 1T,激活参数量 32B Novita AI 模型页面描述,2026 年 6 月 13 日
基础 URL OpenAI 兼容调用使用 https://api.novita.ai/v3/openai Novita AI 文档及现有 Novita 集成示例,2026 年 6 月 13 日
端点家族 chat/completionsanthropic Novita AI 模型页面,2026 年 6 月 13 日
输入模态 文本、图像、视频 Novita AI 模型页面,2026 年 6 月 13 日
输出模态 文本 Novita AI 模型页面,2026 年 6 月 13 日
上下文窗口 262,144 token Novita AI 模型页面,2026 年 6 月 13 日
最大输出 token 数 262,144 token Novita AI 模型页面,2026 年 6 月 13 日
列出的功能 无服务器、函数调用、结构化输出、推理 Novita AI 模型页面,2026 年 6 月 13 日
定价 每 1M 输入 token 0.95 美元,每 1M 缓存读取输入 token 0.19 美元,每 1M 输出 token 4.00 美元 Novita AI 模型页面,2026 年 6 月 13 日
列出的速率限制 T1:30 RPM / 50,000,000 TPM;T2:100 RPM / 50,000,000 TPM;T3:1,000 RPM / 50,000,000 TPM;T4:3,000 RPM / 50,000,000 TPM;T5:6,000 RPM / 50,000,000 TPM Novita AI 模型页面,2026 年 6 月 13 日
最佳适用场景 编程智能体、代码审查、仓库分析、结构化工程助手、多模态开发工作流 基于已验证能力的编辑适配

Kimi K2.7 Code 基准测试与性能信号

目前核实的 Kimi K2.7 Code 公开 Novita AI 来源仅提供产品和 API 事实信息,未包含完整的基准测试表格。模型页面提到该模型在长周期编程任务上有显著提升,思维 token 使用量比 K2.6 低约 30%,但在 2026 年 6 月 13 日核查的页面快照中并未公开可复现的基准测试表格。

信号 已验证内容 开发者启示 来源/日期
编程与智能体定位 模型页面将 Kimi K2.7 Code 描述为支持交错思维、多步工具调用的编程与智能体模型。 建议优先在编程智能体任务上评估该模型,而非通用聊天负载。 Novita AI 模型页面,2026 年 6 月 13 日
长上下文能力 模型页面列明其支持 262,144 上下文 token 和 262,144 最大输出 token。 当应用能妥善管理上下文时,该模型可支持更大的仓库上下文、长设计文档、扩展工具轨迹。 Novita AI 模型页面,2026 年 6 月 13 日
思维 token 效率声明 模型页面称 Kimi K2.7 Code 的思维 token 使用量比 K2.6 低约 30%。 可将此视为有价值的评估假设,在生产迁移前先用自有提示测量总 token 成本。 Novita AI 模型页面,2026 年 6 月 13 日

如果你正从其他编程模型迁移,建议使用固定的评估集,在自有工作负载上测试 Kimi K2.7 Code:评估维度包括仓库问题解决、单元测试修复、代码审查准确率、工具调用有效性、延迟、总输入/输出/缓存读取 token 数,以及安全敏感变更的回归率。

开发者的核心能力

工具调用:构建需要函数调用的智能体

模型页面将函数调用和结构化输出列为支持的功能。当你的应用需要模型调用工具而非仅用散文回答时,这一能力非常重要,适用场景包括仓库搜索、测试执行、检索、工单分类、结构化代码审查、工作流路由等。

工具调用适用于有明确 schema 的边界操作。高风险操作需置于显式的应用校验之后,尤其是当编程智能体可以修改文件、执行命令、发起拉取请求时。

长上下文:保留更多仓库状态可见

262,144 token 的上下文窗口为团队提供了容纳更大代码片段、问题描述、日志、依赖说明、架构约束的空间。这并不意味着可以取消检索或上下文选择,但能让你的智能体有更多空间保留通常在短上下文编程会话中被丢弃的事实信息。

为获得最佳效果,请按优先级组织上下文:任务目标、相关文件、失败的测试输出、API 契约、约束条件,最后才是低优先级的背景信息。长上下文在输入经过筛选时效果最好。

多模态输入:支持视觉驱动的开发工作流

模型页面列明其输入模态为文本、图像、视频,这为 UI 审查、基于截图的缺陷报告、设计转代码提示、视频辅助调试笔记等场景提供了评估路径。由于输出模态为文本,该模型可以描述问题、生成实施计划,或基于多模态证据生成代码变更。

结构化输出:让响应更易自动化

当模型响应需要接入下游自动化时,结构化输出支持非常有用。代码审查助手可以返回严重程度、文件路径、行引用、置信度、建议补丁;分流智能体可以返回组件、可能负责人、复现风险、下一步操作。结构化输出让模型从聊天接口转变为可预测的服务组件。

何时使用 Kimi K2.7 Code

编程智能体与开发者工具

当你的产品需要一个能够推理代码、调用工具、返回结构化结果的 LLM 时,可使用 Kimi K2.7 Code。适用场景包括 IDE 助手、终端编程智能体、拉取请求审查者、测试失败解释器、内部平台机器人、CI 分流工具等。

如果你的团队已经在使用 OpenAI 兼容的工具链,模型页面列出的 chat/completions 端点可以大幅减少集成工作量。

基于长上下文的仓库分析

当模型需要查看的内容不止是短提示时,可使用 Kimi K2.7 Code:比如多文件变更、迁移说明、日志、架构文档、API 契约、长问题线程等。经过核实的上下文窗口为你的应用提供了发送足够上下文以完成严肃分析的空间。

对于超大型仓库,建议将长上下文与检索结合使用。默认不要将整个仓库内容塞入模型,而是选择与任务直接相关的文件和证据。

多模态工程审查

当工程工作流包含截图、UI 视频、视觉缺陷报告时,可使用 Kimi K2.7 Code。经过核实的输入模态使其值得在前端 QA、设计实现审查、视觉回归解释等场景中进行测试。

成本敏感的长运行智能体

由于模型页面列出了缓存读取定价,Kimi K2.7 Code 值得在重复上下文的工作流中评估,这类工作流通常会在多次调用中使用稳定的系统提示、工具 schema、仓库摘要或设计文档。在确定生产默认配置前,请在预发环境测量缓存命中率和总 token 成本。

何时不应使用 Kimi K2.7 Code

不要仅仅因为 Kimi K2.7 Code 是最新的模型名称就选择它。对于简单的 FAQ 机器人、短文本提取任务、低风险分类场景,更小或更便宜的模型可能更易运维。

不要依赖未经证实的基准测试冠军声明。如果你的采购决策依赖基准测试结果,请使用当前正在使用的替代方案运行自有对比,并保持提示、模型设置、评分标准固定。

不要将编程智能体用作无限制的执行器。即使工具调用能力很强,生产系统也应校验工具参数、对命令执行做沙箱隔离、要求对破坏性操作进行审批,并记录模型决策以供审计。

Kimi K2.7 Code 如何适配你的 API 工作流

Kimi K2.7 Code 作为聊天模型适配 Novita AI API 工作流,核心集成参数如下:

  • 模型 ID:moonshotai/kimi-k2.7-code
  • OpenAI 兼容基础 URL:https://api.novita.ai/v3/openai
  • 端点家族:chat/completions
  • 可选兼容路径:anthropic
  • 主要用途:编程、工具调用、结构化输出、长上下文推理、多模态工程输入

实际的落地路径是先在 Kimi K2.7 Code Playground 中测试,将相同的提示迁移到 API 测试框架,再在自有编程任务上评估该模型。请追踪结果质量和总 token 使用量,而非仅关注单 token 定价。

对于编程智能体,建议保留简单的评估表:

评估维度 衡量指标
正确性 生成的修复是否通过测试、是否保留了预期行为?
工具使用 模型是否调用了正确的工具、参数是否合法?
上下文使用 模型是否使用了提供的仓库事实,而非凭空猜测?
成本 每个完成的任务消耗了多少输入、缓存读取、输出 token?
安全性 模型是否避免了破坏性变更、是否标记了不确定的假设?

最终建议

如果你正在构建编程智能体、感知仓库内容的助手、多模态工程审查工具、或需要 OpenAI 兼容 API 访问的长上下文开发者工作流,可使用 Novita AI 上的 Kimi K2.7 Code。从经过核实的模型 ID moonshotai/kimi-k2.7-code 开始,通过 Kimi K2.7 Code API 和 Playground 测试,并使用真实工单、失败的测试、代码审查示例与你当前使用的模型对比。

当你的工作负载是短文本、通用场景,或成本敏感到不需要长上下文和编程智能体功能时,可选择其他模型。

常见问题

Kimi K2.7 Code 是什么?

Kimi K2.7 Code 是 MoonshotAI 推出的面向编程和智能体工作流的聊天模型。Novita AI 模型页面介绍其为总参数量 1T、激活参数量 32B 的 MoE 模型,拥有 256K 上下文窗口,支持交错思维和多步工具调用。

Kimi K2.7 Code 是否已在 Novita AI 上线?

是的。2026 年 6 月 13 日核查时,Novita AI 上的 Kimi K2.7 Code 模型页面 已上线,且列明该模型可用。

Novita AI 上 Kimi K2.7 Code 的模型 ID 是什么?

经过核实的模型 ID 为 moonshotai/kimi-k2.7-code

Novita AI 上的 Kimi K2.7 Code 定价是多少?

2026 年 6 月 13 日核实的定价为:每 1M 输入 token 0.95 美元,每 1M 缓存读取输入 token 0.19 美元,每 1M 输出 token 4.00 美元。

Kimi K2.7 Code 支持哪些端点?

Novita AI 模型页面列明 Kimi K2.7 Code 支持的端点家族为 chat/completionsanthropic

Kimi K2.7 Code 最适合用于哪些场景?

它最适合用于编程智能体、工具调用助手、仓库分析、结构化代码审查,以及依赖长上下文和工具调用的多模态开发工作流。

Kimi K2.7 Code 和 Kimi K2.6 有什么区别?

Novita AI 模型页面介绍,Kimi K2.7 Code 在长周期编程任务上表现更优,思维 token 使用量比 K2.6 低约 30%。你可以将此作为评估起点,在迁移前用自有编程提示验证差异。

推荐阅读