Cómo usar Kimi K2.7 Code en Claude Code a través de Novita AI

Tabla de contenido

¿Por qué usar Kimi K2.7 Code en Claude Code?
Especificaciones de Kimi K2.7 Code de un vistazo
¿Cuánto cuesta Kimi K2.7 Code en Novita AI?
Paso 1: Obtén tu clave API de Novita AI
Paso 2: Instala Claude Code
Paso 3: Configura las variables de entorno
Paso 4: Inicia Claude Code
Consejos prácticos para el flujo de trabajo de codificación
Solución de problemas
FAQ
Artículos recomendados

Kimi K2.7 Code es un modelo MoE especializado en codificación de MoonshotAI con una ventana de contexto de 256K, pensamiento entrelazado y llamada a herramientas multi-paso. A través del endpoint compatible con Anthropic de Novita AI, puedes conectarlo directamente a Claude Code, manteniendo tu flujo de trabajo existente mientras cambias a un modelo construido específicamente para codificación agente a una fracción del precio de Claude Sonnet.

Esta guía te lleva a través de cada paso: obtener tu clave API, configurar variables de entorno e iniciar Claude Code con moonshotai/kimi-k2.7-code como modelo.

¿Por qué usar Kimi K2.7 Code en Claude Code?

Claude Code usa el SDK de Anthropic internamente, por lo que necesita un endpoint compatible con Anthropic, no uno compatible con OpenAI. Novita AI expone exactamente eso en https://api.novita.ai/anthropic, haciendo de Kimi K2.7 Code un modelo intercambiable para Claude Code sin bibliotecas intermedias ni herramientas adicionales. Para la configuración de API compatible con OpenAI, consulta la guía de inicio rápido de la API de Kimi K2.7 Code.

El caso práctico se reduce a tres aspectos:

Costo. A $0.95 por millón de tokens de entrada y $4.00 por millón de tokens de salida en Novita AI (verificado en junio de 2026), Kimi K2.7 Code es aproximadamente un 68 % más barato en entrada y un 73 % más barato en salida que Claude Sonnet 4.5 ($3.00/$15.00 por millón de tokens). Para equipos que ejecutan cientos de tareas de codificación al día, esa diferencia es significativa.

Contexto. La ventana de contexto de 256K tokens significa que puedes enviar contexto sustancial del repositorio (múltiples archivos, salida de pruebas, notas de arquitectura) sin toparte con un límite a mitad de sesión. La mayoría de los agentes de codificación del día a día trabajan bien dentro de 32K–64K tokens; tener 256K significa que rara vez necesitas podar el contexto.

Especialización en codificación. Kimi K2.7 Code está diseñado específicamente para codificación y flujos de trabajo agente, no es un modelo de propósito general. Su arquitectura de pensamiento entrelazado genera ~30 % menos tokens de pensamiento que Kimi K2.6, lo que se traduce en respuestas más rápidas en tareas de codificación multi-paso.

Especificaciones de Kimi K2.7 Code de un vistazo

Campo	Valor
ID del modelo	`moonshotai/kimi-k2.7-code`
Arquitectura	Mixture of Experts (MoE)
Parámetros totales	1T
Parámetros activados	32B por token
Ventana de contexto	262,144 tokens (~256K)
Máximo de tokens de salida	262,144 tokens
Modalidades de entrada	Texto, imagen, video
Modalidad de salida	Texto
Características	Llamada a funciones, salidas estructuradas, razonamiento (pensamiento entrelazado)
Endpoints en Novita AI	`chat/completions`, `anthropic`

Para Claude Code, usa la familia de endpoints anthropic — que es lo que espera el SDK de Anthropic.

¿Cuánto cuesta Kimi K2.7 Code en Novita AI?

Tipo de token	Precio en Novita AI	Precio de Claude Sonnet 4.5
Entrada	$0.95 / 1M	$3.00 / 1M
Entrada con lectura de caché	$0.19 / 1M	—
Salida	$4.00 / 1M	$15.00 / 1M

Precios basados en la página del modelo Kimi K2.7 Code en Novita AI a junio de 2026. Novita AI también muestra precios de lectura de caché, lo cual es importante para flujos de trabajo con contexto repetido, como agentes que reutilizan el mismo mensaje de sistema y esquema de herramientas en muchas llamadas.

Paso 1: Obtén tu clave API de Novita AI

Regístrate para una cuenta de Novita AI — las cuentas nuevas reciben créditos de prueba gratuitos.

Una vez que hayas iniciado sesión:

Ve a Key Management en tu panel de control.
Haz clic en Create New Key.
Copia la clave inmediatamente y guárdala en un lugar seguro — solo se muestra una vez.

Usarás esta clave como ANTHROPIC_AUTH_TOKEN en el siguiente paso.

Paso 2: Instala Claude Code

Claude Code requiere Node.js 18 o superior. Verifica tu versión primero:

node --version

Instala Claude Code globalmente:

npm install -g @anthropic-ai/claude-code

Verifica la instalación:

claude --version

Paso 3: Configura las variables de entorno

Claude Code lee cuatro variables de entorno para saber qué endpoint, clave API y modelo usar. Configúralas todas — ANTHROPIC_SMALL_FAST_MODEL controla qué modelo usa Claude Code para subtareas ligeras como resúmenes y ediciones rápidas.

Mac y Linux

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="TU_CLAVE_API_DE_NOVITA"
export ANTHROPIC_MODEL="moonshotai/kimi-k2.7-code"
export ANTHROPIC_SMALL_FAST_MODEL="moonshotai/kimi-k2.7-code"

Para hacerlas permanentes, agrega las cuatro líneas a ~/.zshrc o ~/.bashrc, luego ejecuta source ~/.zshrc (o ~/.bashrc).

Windows (Command Prompt)

set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=TU_CLAVE_API_DE_NOVITA
set ANTHROPIC_MODEL=moonshotai/kimi-k2.7-code
set ANTHROPIC_SMALL_FAST_MODEL=moonshotai/kimi-k2.7-code

Estas variables de entorno duran solo para la sesión actual. Para una configuración permanente en Windows, agrégalas a través de System Properties → Environment Variables.

Qué hace cada variable

Variable	Valor	Propósito
`ANTHROPIC_BASE_URL`	`https://api.novita.ai/anthropic`	Apunta Claude Code al endpoint compatible con Anthropic de Novita AI
`ANTHROPIC_AUTH_TOKEN`	Tu clave API de Novita	Autentica tus solicitudes
`ANTHROPIC_MODEL`	`moonshotai/kimi-k2.7-code`	Establece el modelo principal para tareas de codificación
`ANTHROPIC_SMALL_FAST_MODEL`	`moonshotai/kimi-k2.7-code`	Establece el modelo para subtareas ligeras

Paso 4: Inicia Claude Code

Navega al directorio de tu proyecto e inicia una sesión:

cd tu-directorio-de-proyecto
claude .

Claude Code abre un prompt interactivo. Ahora puedes describir tareas en lenguaje natural — implementar una función, corregir un error, refactorizar un módulo, escribir pruebas — y Kimi K2.7 Code maneja el razonamiento y la generación de código a través del endpoint de Novita AI.

Para verificar que el modelo se está enrutando correctamente, ejecuta /status dentro de la sesión de Claude Code. Debería mostrar la URL base y el modelo configurados.

Consejos prácticos para el flujo de trabajo de codificación

Envía más contexto de antemano. Con 256K tokens disponibles, puedes incluir el contenido completo de los archivos relevantes en lugar de solo extractos. Claude Code puede hacer referencia al código real en lugar de razonar a partir de resúmenes, lo que reduce las alucinaciones en los detalles de implementación.

Usa el pensamiento entrelazado para tareas complejas. Kimi K2.7 Code razona paso a paso antes de generar código. Para refactorizaciones multi-archivo o decisiones de arquitectura, dale al modelo suficiente contexto para ver el panorama completo — planificará antes de escribir, lo que reduce las correcciones posteriores.

Depuración multimodal. Kimi K2.7 Code acepta imágenes y video como entrada. Si tu flujo de trabajo incluye informes de errores basados en capturas de pantalla o tareas de revisión de interfaz de usuario, puedes enviarlos directamente a la sesión. Las respuestas siempre son texto, por lo que la salida es código, planes o análisis.

Mensajes de sistema con mucho caché. Si usas un mensaje de sistema consistente en muchas sesiones (estándares de codificación, convenciones del proyecto, notas de arquitectura), el precio de lectura de caché de Novita AI a $0.19 por millón de tokens se aplica al contenido repetido. Para equipos con mensajes de sistema largos y estables, esto reduce significativamente el costo por tarea.

Mantente en un solo modelo para consistencia. Establecer tanto ANTHROPIC_MODEL como ANTHROPIC_SMALL_FAST_MODEL en moonshotai/kimi-k2.7-code mantiene un comportamiento consistente en la tarea principal y las subtareas. Si luego deseas un modelo más ligero para subtareas para ahorrar costos, puedes cambiar solo ANTHROPIC_SMALL_FAST_MODEL.

Solución de problemas

401 No autorizado

Tu clave API es incorrecta o ha expirado. Verifica la clave en Novita AI Key Management. Revisa si hay espacios adicionales o saltos de línea al copiar la clave.

Modelo no encontrado / 404

Confirma que el ID del modelo sea exactamente moonshotai/kimi-k2.7-code — sin espacios adicionales, con la capitalización correcta. Puedes verificarlo en la página del modelo Kimi K2.7 Code.

Respuestas lentas en prompts largos

Habilita el streaming por defecto en Claude Code — la mayoría de las configuraciones lo hacen automáticamente. Para entradas de contexto muy largas (100K+ tokens), la latencia de respuesta inicial aumenta. Considera recortar primero el contexto de baja prioridad.

Variables de entorno no detectadas

En Mac/Linux, confirma que hayas cargado el archivo de perfil después de editarlo (source ~/.zshrc). En Windows, las variables de entorno configuradas con set duran solo para la sesión actual del Command Prompt — usa el panel de System Properties para variables persistentes.

FAQ

¿Kimi K2.7 Code funciona con el uso de herramientas y las integraciones MCP de Claude Code?

Sí. Kimi K2.7 Code admite llamadas a funciones a través del endpoint compatible con Anthropic de Novita AI, que es lo que Claude Code usa para las llamadas a herramientas y las integraciones MCP.

¿Por qué usar el endpoint de Anthropic en lugar del compatible con OpenAI?

Claude Code está construido sobre el SDK de Anthropic. Se comunica usando el formato de mensajes de Anthropic, no el de OpenAI. El endpoint https://api.novita.ai/anthropic de Novita AI traduce ese formato, por lo que Claude Code funciona sin ninguna modificación.

¿Cómo se compara Kimi K2.7 Code con Kimi K2.5 para Claude Code?

Kimi K2.7 Code genera aproximadamente un 30 % menos de tokens de pensamiento que K2.6 (y mejora la eficiencia de K2.5), manteniendo la calidad de codificación. Para sesiones de Claude Code con tareas multi-paso repetidas, menos tokens de pensamiento significan respuestas más rápidas y menor costo de tokens por tarea.

¿Puedo usar esta configuración en VS Code o Cursor?

Sí. Claude Code se integra con VS Code y Cursor a través de plugins y la terminal. Se aplica la misma configuración de variables de entorno — una vez establecidas, tanto las integraciones del IDE como la terminal independiente usan el modelo configurado.

Novita AI es una plataforma en la nube de IA que ofrece a los desarrolladores una forma sencilla de acceder a modelos de última generación a través de una API simple, con una infraestructura GPU asequible y confiable.

Cómo usar Kimi K2.7 Code en Claude Code a través de Novita AI

¿Por qué usar Kimi K2.7 Code en Claude Code?

Especificaciones de Kimi K2.7 Code de un vistazo

¿Cuánto cuesta Kimi K2.7 Code en Novita AI?

Paso 1: Obtén tu clave API de Novita AI

Paso 2: Instala Claude Code

Paso 3: Configura las variables de entorno

Mac y Linux

Windows (Command Prompt)

Qué hace cada variable

Paso 4: Inicia Claude Code

Consejos prácticos para el flujo de trabajo de codificación

Solución de problemas

FAQ

Artículos recomendados

Product

RESOURCES

Partners

Company

¿Por qué usar Kimi K2.7 Code en Claude Code?

Especificaciones de Kimi K2.7 Code de un vistazo

¿Cuánto cuesta Kimi K2.7 Code en Novita AI?

Paso 1: Obtén tu clave API de Novita AI

Paso 2: Instala Claude Code

Paso 3: Configura las variables de entorno

Mac y Linux

Windows (Command Prompt)

Qué hace cada variable

Paso 4: Inicia Claude Code

Consejos prácticos para el flujo de trabajo de codificación

Solución de problemas

FAQ

Artículos recomendados

Publicaciones relacionadas

Product

RESOURCES

Partners

Company