Guía rápida de la API de Kimi K2.7 Code en Novita AI

Guía rápida de la API de Kimi K2.7 Code en Novita AI

Kimi K2.7 Code está disponible en Novita AI con el ID de modelo moonshotai/kimi-k2.7-code, un endpoint chat/completions compatible con OpenAI, una ventana de contexto de 262,144 tokens y soporte para entradas de texto, imagen y video. Esta guía rápida cubre la configuración para desarrolladores: autenticarse, enviar tu primera solicitud, usar entrada de imágenes, agregar llamada a funciones y comprender los precios antes de construir. Para una visión más amplia sobre posicionamiento y casos de uso, consulta la visión general de Kimi K2.7 Code en Novita AI.

Configuración de la API de Kimi K2.7 Code

Comienza con tres elementos de configuración:

Elemento Valor
Clave de API Crea y almacena una clave de API de Novita AI en una variable de entorno como NOVITA_API_KEY.
URL base compatible con OpenAI https://api.novita.ai/openai
Endpoint de completaciones de chat POST https://api.novita.ai/openai/v1/chat/completions
ID del modelo moonshotai/kimi-k2.7-code

El índice de documentación de Novita AI enumera la URL base compatible con OpenAI, y la referencia de la API de completaciones de chat documenta todos los campos de solicitud y respuesta.

Mantén la clave de API fuera del control de versiones. Expórtala en tu shell para desarrollo local:

export NOVITA_API_KEY="tu_clave_api"

Si tu aplicación ya utiliza el SDK de OpenAI, el cambio es mínimo: apunta la URL base a Novita AI y establece el modelo en moonshotai/kimi-k2.7-code.

Precios y límites de Kimi K2.7 Code

Usa el ID de modelo exacto en el código. En la interfaz de usuario, usa el nombre visible “Kimi K2.7 Code”.

Campo Valor actual en Novita
Nombre visible Kimi K2.7 Code
ID del modelo de API moonshotai/kimi-k2.7-code
Serie del modelo MoonshotAI
Arquitectura MoE, 1T parámetros totales, 32B activados
Familias de endpoints chat/completions, anthropic
Modalidades de entrada Texto, imagen, video
Modalidad de salida Texto
Ventana de contexto 262,144 tokens
Máximo de tokens de salida 262,144 tokens
Funcionalidades Llamada a funciones, salidas estructuradas, razonamiento

Al 16 de junio de 2026, Novita lista estos precios por token para moonshotai/kimi-k2.7-code:

Tipo de token Precio listado
Tokens de entrada $0.95 por 1M de tokens
Tokens de salida $4.00 por 1M de tokens
Tokens de entrada de lectura de caché $0.19 por 1M de tokens

Los precios, la disponibilidad y los límites de tasa pueden cambiar. Consulta la página del modelo Kimi K2.7 Code y la página de precios de Novita AI antes del lanzamiento a producción o cualquier compromiso de costos.

Ejemplo con cURL de Kimi K2.7 Code

Comienza con una solicitud solo de texto para confirmar la autenticación, el enrutamiento del modelo y el análisis de la respuesta antes de agregar visión o llamadas a herramientas.

curl "https://api.novita.ai/openai/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer ${NOVITA_API_KEY}" \
  -d '{
    "model": "moonshotai/kimi-k2.7-code",
    "messages": [
      {
        "role": "system",
        "content": "Eres un asistente de revisión de código conciso."
      },
      {
        "role": "user",
        "content": "Enumera tres errores comunes al implementar lógica de reintento en Python."
      }
    ],
    "max_tokens": 512,
    "temperature": 0.2
  }'

Una respuesta exitosa devuelve la estructura estándar de completaciones de chat: un array choices, un mensaje con content, metadatos de modelo/creación y un objeto usage con conteos de tokens de prompt, completación y totales.

Usa esta prueba de humo para verificar:

  • La clave de API es válida y el encabezado de autorización tiene el formato correcto.
  • El ID del modelo se acepta sin un error 404 o modelo no encontrado.
  • Tu cliente puede analizar choices[0].message.content.
  • El uso de tokens se registra para que puedas monitorear el costo desde la primera solicitud.

Ejemplo en Python de Kimi K2.7 Code

El SDK de Python de OpenAI funciona con Novita AI cuando configuras la URL base de Novita. Fija la versión del SDK según tu propia política de dependencias.

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "Eres un asistente de revisión de código conciso."},
        {
            "role": "user",
            "content": "Revisa esta función de Python en busca de errores de off-by-one y casos límite faltantes:\n\ndef get_items(lst, start, end):\n    return lst[start:end]",
        },
    ],
    max_tokens=512,
    temperature=0.2,
)

print(response.choices[0].message.content)
print("Tokens usados:", response.usage.total_tokens)

Para sesiones largas de agentes de código, establece max_tokens explícitamente. Kimi K2.7 Code admite hasta 262,144 tokens de salida, pero los agentes de producción deben presupuestar el uso de tokens por turno y monitorear el costo acumulado a lo largo de ejecuciones de varios pasos.

Entrada de imágenes y video

Novita lista texto, imagen y video como modalidades de entrada para Kimi K2.7 Code. Para entrada de visión, pasa un array content en el mensaje de usuario con una parte de text y una parte de image_url:

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "Eres un asistente de revisión de código de UI."},
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Describe cualquier problema de accesibilidad visible en esta captura de pantalla de UI y sugiere correcciones CSS.",
                },
                {
                    "type": "image_url",
                    "image_url": {"url": "https://example.com/screenshot.png"},
                },
            ],
        },
    ],
    max_tokens=512,
)

print(response.choices[0].message.content)

Un orden práctico para la integración multimodal:

  1. Primero confirma que la prueba de humo solo de texto funciona.
  2. Agrega una entrada de imagen con una tarea claramente verificable, como extraer etiquetas de una captura de pantalla de UI.
  3. Valida tanto la calidad de la respuesta como la forma de la respuesta para tu carga de trabajo real.
  4. Prueba las entradas de video por separado: comienza con clips cortos, verifica el formato de la solicitud y mide la latencia y los costos de tokens antes de agregar video a una ruta de producción.

No asumas que cada carga útil multimodal compatible con OpenAI se acepta de manera idéntica por cada modelo alojado en Novita. Verifica la forma exacta de la carga útil de imagen y video en la documentación actual de Novita AI o en ejemplos de la consola para moonshotai/kimi-k2.7-code antes de implementar.

Llamada a funciones y salidas estructuradas

Kimi K2.7 Code admite llamada a funciones a través del parámetro tools y salidas estructuradas a través de response_format. Ambos están listados como funcionalidades en la página del modelo de Novita AI.

Usa llamada a funciones cuando el modelo deba seleccionar una herramienta y devolver argumentos estructurados en lugar de responder en prosa:

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key=os.environ["NOVITA_API_KEY"],
)

tools = [
    {
        "type": "function",
        "function": {
            "name": "file_search",
            "description": "Busca en el repositorio archivos que coincidan con un patrón.",
            "parameters": {
                "type": "object",
                "properties": {
                    "pattern": {
                        "type": "string",
                        "description": "Patrón glob para coincidir, ej. '**/*.py'",
                    },
                    "directory": {
                        "type": "string",
                        "description": "Directorio raíz para buscar.",
                    },
                },
                "required": ["pattern"],
            },
        },
    }
]

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.7-code",
    messages=[
        {"role": "system", "content": "Eres un asistente de análisis de repositorios."},
        {
            "role": "user",
            "content": "Encuentra todos los archivos Python en el directorio src que puedan contener lógica de migración de base de datos.",
        },
    ],
    tools=tools,
    tool_choice="auto",
    temperature=0.1,
)

message = response.choices[0].message
if message.tool_calls:
    for call in message.tool_calls:
        print(f"Tool: {call.function.name}")
        print(f"Argumentos: {call.function.arguments}")
else:
    print(message.content)

Para salidas estructuradas, usa response_format con json_schema cuando necesites una respuesta JSON validada sin una llamada a herramienta. Mantén los esquemas iniciales pequeños y prueba tu analizador sintáctico contra la forma exacta de respuesta que devuelve moonshotai/kimi-k2.7-code antes de depender del modo estricto en producción.

La arquitectura de razonamiento intercalado de Kimi K2.7 Code significa que razona a través de tareas de varios pasos antes de devolver un resultado. Para flujos de trabajo de codificación agentivos con múltiples llamadas a herramientas por turno, prueba cómo se comportan la elección de herramienta, la calidad de los argumentos y la latencia de respuesta en tu conjunto de tareas real antes de enrutar tráfico de producción.

Lista de verificación para pruebas en producción

Kimi K2.7 Code tiene precios separados para tokens de entrada, salida y lectura de caché. Los perfiles de costo varían significativamente según la carga de trabajo:

  • Revisión de código de contexto largo: los recuentos grandes de tokens de entrada dominan el costo.
  • Agentes de generación de código: el uso de tokens de salida escala con la longitud de la respuesta y el número de turnos.
  • Flujos de trabajo con contexto repetido: el precio de lectura de caché se aplica cuando un mensaje de sistema estable, un esquema de herramienta o un resumen de repositorio se repite en muchas llamadas.

Antes de producción, ejecuta un conjunto de evaluación que incluya:

  • Prompts cortos solo de texto (línea base de latencia y verificación de autenticación).
  • Prompts de contexto largo cerca de tu tamaño de trabajo esperado, no la ventana máxima.
  • Prompts de llamada a herramientas donde el comportamiento correcto sea llamar a una función con argumentos válidos.
  • Entradas de imagen que coincidan con tu fuente de carga real y manejo de archivos.
  • Casos de fallo: entrada sobredimensionada, URL de medio faltante, clave de API inválida y comportamiento de tiempo de espera.

Las listas de funcionalidades describen lo que está disponible. La evaluación en tu carga de trabajo real te dice si la latencia, el uso de tokens, la calidad de los argumentos de la herramienta y la corrección de la salida cumplen con tu estándar de producción.

Preguntas frecuentes

¿Kimi K2.7 Code está disponible a través de Novita AI?

Sí. Novita AI lista Kimi K2.7 Code como un LLM Serverless con el ID de modelo de API moonshotai/kimi-k2.7-code.

¿Cuál es el ID de modelo correcto?

Usa moonshotai/kimi-k2.7-code en todas las llamadas a la API.

¿Qué endpoint debo usar?

Usa el endpoint de completaciones de chat compatible con OpenAI: POST https://api.novita.ai/openai/v1/chat/completions. Establece la URL base en https://api.novita.ai/openai al usar un cliente del SDK de OpenAI.

¿Cuánto cuesta Kimi K2.7 Code?

Al 16 de junio de 2026, Novita AI lista $0.95 por 1M de tokens de entrada, $4.00 por 1M de tokens de salida y $0.19 por 1M de tokens de entrada de lectura de caché. Verifica los precios actuales en la página del modelo Kimi K2.7 Code antes de cualquier decisión de adquisición.

¿Admite entrada de imágenes y video?

Novita lista texto, imagen y video como modalidades de entrada. Para la forma exacta de la carga útil, verifica con la documentación actual de Novita o una llamada de prueba antes de implementar funcionalidades multimodales.

¿Kimi K2.7 Code admite llamada a funciones?

Sí. Usa el parámetro tools en la solicitud de completaciones de chat. Novita lista llamada a funciones y salidas estructuradas como funcionalidades admitidas.

¿Cuál es la ventana de contexto?

Ventana de contexto de 262,144 tokens y máximo de salida de 262,144 tokens, según lo listado en la página del modelo de Novita AI.

Artículos recomendados