Inicio rápido de la API de Kimi K2.7 Code en Novita AI

Tabla de contenido

Configuración de la API de Kimi K2.7 Code
Precios y límites de Kimi K2.7 Code
Ejemplo de cURL para Kimi K2.7 Code
Ejemplo de Python para Kimi K2.7 Code
Entrada de imágenes y video
Llamada a funciones y salidas estructuradas
Lista de verificación para pruebas en producción
Preguntas frecuentes
Artículos recomendados

Kimi K2.7 Code está disponible en Novita AI con el ID de modelo moonshotai/kimi-k2.7-code, un endpoint chat/completions compatible con OpenAI, una ventana de contexto de 262,144 tokens y soporte para entrada de texto, imagen y video. Este inicio rápido cubre la configuración del desarrollador: autenticación, envío de tu primera solicitud, uso de entrada de visión, adición de llamada a funciones y comprensión de los precios antes de construir. Para una visión más amplia sobre posicionamiento y casos de uso, consulta la visión general de Kimi K2.7 Code en Novita AI. Para integrar Kimi K2.7 Code en Claude Code a través del endpoint compatible con Anthropic, consulta Cómo usar Kimi K2.7 Code en Claude Code.

Configuración de la API de Kimi K2.7 Code

Comienza con tres elementos de configuración:

Elemento	Valor
API key	Crea y almacena una clave de API de Novita AI en una variable de entorno como `NOVITA_API_KEY`.
URL base compatible con OpenAI	`https://api.novita.ai/openai`
Endpoint de chat completions	`POST https://api.novita.ai/openai/v1/chat/completions`
ID del modelo	`moonshotai/kimi-k2.7-code`

El índice de documentación de Novita AI enumera la URL base compatible con OpenAI, y la referencia de la API de chat completions documenta los campos completos de solicitud y respuesta.

Mantén la clave de API fuera del control de versiones. Expórtala en tu shell para desarrollo local:

export NOVITA_API_KEY="your_api_key"

Si tu aplicación ya usa el SDK de OpenAI, el cambio es mínimo: apunta la URL base a Novita AI y establece el modelo como moonshotai/kimi-k2.7-code.

Precios y límites de Kimi K2.7 Code

Usa el ID exacto del modelo en el código. En la interfaz de usuario, usa el nombre visible “Kimi K2.7 Code”.

Campo	Valor actual en Novita
Nombre visible	Kimi K2.7 Code
ID del modelo en API	`moonshotai/kimi-k2.7-code`
Serie del modelo	MoonshotAI
Arquitectura	MoE, 1T parámetros en total, 32B activados
Familias de endpoints	`chat/completions`, `anthropic`
Modalidades de entrada	Texto, imagen, video
Modalidad de salida	Texto
Ventana de contexto	262,144 tokens
Máximo de tokens de salida	262,144 tokens
Funcionalidades	Llamada a funciones, salidas estructuradas, razonamiento

A partir del 16 de junio de 2026, Novita lista estos precios por token para moonshotai/kimi-k2.7-code:

Tipo de token	Precio listado
Tokens de entrada	$0.95 por 1M de tokens
Tokens de salida	$4.00 por 1M de tokens
Tokens de entrada leídos de caché	$0.19 por 1M de tokens

Los precios, la disponibilidad y los límites de tasa pueden cambiar. Consulta la página del modelo Kimi K2.7 Code y la página de precios de Novita AI antes del lanzamiento a producción o cualquier compromiso de costos.

Ejemplo de cURL para Kimi K2.7 Code

Comienza con una solicitud solo de texto para verificar la autenticación, el enrutamiento del modelo y el análisis de la respuesta antes de agregar llamadas de visión o herramientas.

curl "https://api.novita.ai/openai/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${NOVITA_API_KEY}" \
  -d '{
    "model": "moonshotai/kimi-k2.7-code",
    "messages": [
      {
        "role": "system",
        "content": "You are a concise code review assistant."
      },
      {
        "role": "user",
        "content": "List three common mistakes when implementing retry logic in Python."
      }
    ],
    "max_tokens": 512,
    "temperature": 0.2
  }'

Una respuesta exitosa devuelve la estructura estándar de chat completions: un array choices, un mensaje con content, metadatos de model/created, y un objeto usage con conteos de tokens de prompt, completion y total.

Usa esta prueba de humo para verificar:

La clave de API es válida y el encabezado de autorización tiene el formato correcto.
El ID del modelo es aceptado sin un error 404 o de modelo no encontrado.
Tu cliente puede analizar choices[0].message.content.
El uso de tokens se registra para que puedas monitorear el costo desde la primera solicitud.

Ejemplo de Python para Kimi K2.7 Code

El SDK de Python de OpenAI funciona con Novita AI cuando configuras la URL base de Novita. Fija la versión del SDK según tu propia política de dependencias.

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "You are a concise code review assistant."},
        {
            "role": "user",
            "content": "Review this Python function for off-by-one errors and missing edge cases:\n\ndef get_items(lst, start, end):\n    return lst[start:end]",
        },
    ],
    max_tokens=512,
    temperature=0.2,
)

print(response.choices[0].message.content)
print("Tokens used:", response.usage.total_tokens)

Para sesiones largas de agentes de codificación, establece max_tokens explícitamente. Kimi K2.7 Code admite hasta 262,144 tokens de salida, pero los agentes de producción deben presupuestar el uso de tokens por turno y monitorear el costo acumulado en ejecuciones de múltiples pasos.

Entrada de imágenes y video

Novita enumera texto, imagen y video como modalidades de entrada para Kimi K2.7 Code. Para entrada de visión, pasa un array content en el mensaje del usuario con una parte text y una parte image_url:

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "You are a UI code review assistant."},
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Describe any accessibility issues visible in this UI screenshot and suggest CSS fixes.",
                },
                {
                    "type": "image_url",
                    "image_url": {"url": "https://example.com/screenshot.png"},
                },
            ],
        },
    ],
    max_tokens=512,
)

print(response.choices[0].message.content)

Un orden práctico para la integración multimodal:

Primero, confirma que la prueba de humo solo de texto funciona.
Agrega una entrada de imagen con una tarea claramente verificable, como extraer etiquetas de una captura de pantalla de una interfaz de usuario.
Valida tanto la calidad de la respuesta como la forma de la respuesta para tu carga de trabajo real.
Prueba las entradas de video por separado: comienza con clips cortos, verifica el formato de la solicitud y mide la latencia y los costos de tokens antes de agregar video a una ruta de producción.

No asumas que cada carga útil multimodal compatible con OpenAI es aceptada de manera idéntica por cada modelo alojado en Novita. Verifica la forma exacta de la carga útil de imagen y video en la documentación actual de Novita AI o en ejemplos de la consola para moonshotai/kimi-k2.7-code antes de lanzar.

Llamada a funciones y salidas estructuradas

Kimi K2.7 Code admite llamada a funciones a través del parámetro tools y salidas estructuradas a través de response_format. Ambos están listados como funcionalidades en la página del modelo de Novita AI.

Usa la llamada a funciones cuando el modelo deba seleccionar una herramienta y devolver argumentos estructurados en lugar de responder en prosa:

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

tools = [
    {
        "type": "function",
        "function": {
            "name": "file_search",
            "description": "Search the repository for files matching a pattern.",
            "parameters": {
                "type": "object",
                "properties": {
                    "pattern": {
                        "type": "string",
                        "description": "Glob pattern to match, e.g. '**/*.py'",
                    },
                    "directory": {
                        "type": "string",
                        "description": "Root directory to search within.",
                    },
                },
                "required": ["pattern"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "You are a repository analysis assistant."},
        {
            "role": "user",
            "content": "Find all Python files in the src directory that might contain database migration logic.",
        },
    ],
    tools=tools,
    tool_choice="auto",
    temperature=0.1,
)

message = response.choices[0].message
if message.tool_calls:
    for call in message.tool_calls:
        print(f"Tool: {call.function.name}")
        print(f"Arguments: {call.function.arguments}")
else:
    print(message.content)

Para salidas estructuradas, usa response_format con json_schema cuando necesites una respuesta JSON validada sin una llamada a herramienta. Mantén los esquemas iniciales pequeños y prueba tu analizador contra la forma exacta de respuesta que devuelve moonshotai/kimi-k2.7-code antes de depender del modo estricto en producción.

La arquitectura de pensamiento intercalado de Kimi K2.7 Code significa que razona a través de tareas de múltiples pasos antes de devolver un resultado. Para flujos de trabajo de codificación basados en agentes con múltiples llamadas a herramientas por turno, prueba cómo se comportan la elección de herramientas, la calidad de los argumentos y la latencia de respuesta en tu conjunto de tareas real antes de enrutar tráfico de producción.

Lista de verificación para pruebas en producción

Kimi K2.7 Code tiene un precio separado para tokens de entrada, salida y lectura de caché. Los perfiles de costo varían significativamente según la carga de trabajo:

Revisión de código de contexto largo: los grandes recuentos de tokens de entrada dominan el costo.
Agentes de generación de código: el uso de tokens de salida escala con la longitud de la respuesta y el número de turnos.
Flujos de trabajo de contexto repetido: el precio de lectura de caché se aplica cuando un mensaje del sistema estable, un esquema de herramientas o un resumen del repositorio se repiten en muchas llamadas.

Antes de la producción, ejecuta un conjunto de evaluación que incluya:

Indicaciones cortas solo de texto (línea base de latencia y verificación de autenticación).
Indicaciones de contexto largo cercanas a tu tamaño de trabajo esperado, no la ventana máxima.
Indicaciones con llamada a herramientas donde el comportamiento correcto sea llamar a una función con argumentos válidos.
Entradas de imagen que coincidan con tu fuente de carga real y manejo de archivos.
Casos de error: entrada de gran tamaño, URL de medio faltante, clave de API inválida y comportamiento de tiempo de espera.

Las listas de funcionalidades describen lo que está disponible. La evaluación en tu carga de trabajo real te dice si la latencia, el uso de tokens, la calidad de los argumentos de las herramientas y la corrección de las salidas cumplen con tu estándar de producción.

Preguntas frecuentes

¿Está disponible Kimi K2.7 Code a través de Novita AI?

Sí. Novita AI lista Kimi K2.7 Code como un LLM Serverless con el ID de modelo de API moonshotai/kimi-k2.7-code.

¿Cuál es el ID de modelo correcto?

Usa moonshotai/kimi-k2.7-code en todas las llamadas a la API.

¿Qué endpoint debo usar?

Usa el endpoint de chat completions compatible con OpenAI: POST https://api.novita.ai/openai/v1/chat/completions. Establece la URL base en https://api.novita.ai/openai cuando uses un cliente del SDK de OpenAI.

¿Cuánto cuesta Kimi K2.7 Code?

A partir del 16 de junio de 2026, Novita AI lista $0.95 por 1M de tokens de entrada, $4.00 por 1M de tokens de salida y $0.19 por 1M de tokens de entrada leídos de caché. Verifica los precios actuales en la página del modelo Kimi K2.7 Code antes de cualquier decisión de adquisición.

¿Admite entrada de imágenes y video?

Novita lista texto, imagen y video como modalidades de entrada. Para la forma exacta de la carga útil, verifica con la documentación actual de Novita o con una llamada de prueba antes de lanzar funcionalidades multimodales.

¿Kimi K2.7 Code admite llamada a funciones?

Sí. Usa el parámetro tools en la solicitud de chat completions. Novita lista la llamada a funciones y las salidas estructuradas como funcionalidades admitidas.

¿Cuál es la ventana de contexto?

262,144 tokens de ventana de contexto y 262,144 tokens de salida máxima, según la página del modelo de Novita AI.

Inicio rápido de la API de Kimi K2.7 Code en Novita AI

Configuración de la API de Kimi K2.7 Code

Precios y límites de Kimi K2.7 Code

Ejemplo de cURL para Kimi K2.7 Code

Ejemplo de Python para Kimi K2.7 Code

Entrada de imágenes y video

Llamada a funciones y salidas estructuradas

Lista de verificación para pruebas en producción

Preguntas frecuentes

¿Está disponible Kimi K2.7 Code a través de Novita AI?

¿Cuál es el ID de modelo correcto?

¿Qué endpoint debo usar?

¿Cuánto cuesta Kimi K2.7 Code?

¿Admite entrada de imágenes y video?

¿Kimi K2.7 Code admite llamada a funciones?

¿Cuál es la ventana de contexto?

Artículos recomendados

Product

RESOURCES

Partners

Company

Configuración de la API de Kimi K2.7 Code

Precios y límites de Kimi K2.7 Code

Ejemplo de cURL para Kimi K2.7 Code

Ejemplo de Python para Kimi K2.7 Code

Entrada de imágenes y video

Llamada a funciones y salidas estructuradas

Lista de verificación para pruebas en producción

Preguntas frecuentes

¿Está disponible Kimi K2.7 Code a través de Novita AI?

¿Cuál es el ID de modelo correcto?

¿Qué endpoint debo usar?

¿Cuánto cuesta Kimi K2.7 Code?

¿Admite entrada de imágenes y video?

¿Kimi K2.7 Code admite llamada a funciones?

¿Cuál es la ventana de contexto?

Artículos recomendados

Publicaciones relacionadas

Product

RESOURCES

Partners

Company