- ¿Por qué usar Kimi K2.7 Code en Claude Code?
- Especificaciones de Kimi K2.7 Code de un vistazo
- ¿Cuánto cuesta Kimi K2.7 Code en Novita AI?
- Paso 1: Obtén tu clave API de Novita AI
- Paso 2: Instalar Claude Code
- Paso 3: Configurar variables de entorno
- Paso 4: Iniciar Claude Code
- Consejos prácticos para flujos de trabajo de codificación
- Solución de problemas
- Preguntas frecuentes
- Artículos recomendados
Kimi K2.7 Code es un modelo MoE especializado en codificación de MoonshotAI con una ventana de contexto de 256K, pensamiento intercalado y llamada a herramientas de múltiples pasos. A través del endpoint compatible con Anthropic de Novita AI, puedes conectarlo directamente a Claude Code — manteniendo tu flujo de trabajo existente mientras cambias a un modelo diseñado específicamente para codificación agéntica a una fracción del precio de Claude Sonnet.
Esta guía recorre cada paso: obtener tu clave API, configurar variables de entorno e iniciar Claude Code con moonshotai/kimi-k2.7-code como modelo.
¿Por qué usar Kimi K2.7 Code en Claude Code?
Claude Code utiliza internamente el SDK de Anthropic, por lo que necesita un endpoint compatible con Anthropic — no uno compatible con OpenAI. Novita AI expone exactamente eso en https://api.novita.ai/anthropic, convirtiendo a Kimi K2.7 Code en un modelo intercambiable para Claude Code sin necesidad de bibliotecas envolventes ni herramientas adicionales.
El caso práctico se reduce a tres cosas:
Costo. Con $0.95 por millón de tokens de entrada y $4.00 por millón de tokens de salida en Novita AI (verificado junio 2026), Kimi K2.7 Code es aproximadamente un 68% más barato en entrada y un 73% más barato en salida que Claude Sonnet 4.5 ($3.00/$15.00 por millón de tokens). Para equipos que ejecutan cientos de tareas de codificación al día, esa diferencia es significativa.
Contexto. La ventana de contexto de 256K tokens significa que puedes enviar un contexto de repositorio sustancial — múltiples archivos, salida de pruebas, notas de arquitectura — sin encontrar un límite a mitad de sesión. La mayoría de los agentes de codificación diarios funcionan bien dentro de 32K–64K tokens; tener 256K significa que rara vez necesitas podar el contexto.
Especialización en codificación. Kimi K2.7 Code está diseñado específicamente para flujos de trabajo de codificación y agentes, no es un modelo de propósito general. Su arquitectura de pensamiento intercalado genera ~30% menos tokens de pensamiento que Kimi K2.6, lo que se traduce en respuestas más rápidas en tareas de codificación de múltiples pasos.
Especificaciones de Kimi K2.7 Code de un vistazo
| Campo | Valor |
|---|---|
| ID del modelo | moonshotai/kimi-k2.7-code |
| Arquitectura | Mixture of Experts (MoE) |
| Parámetros totales | 1T |
| Parámetros activados | 32B por token |
| Ventana de contexto | 262.144 tokens (~256K) |
| Máximo de tokens de salida | 262.144 tokens |
| Modalidades de entrada | Texto, imagen, video |
| Modalidad de salida | Texto |
| Características | Llamada a funciones, salidas estructuradas, razonamiento (pensamiento intercalado) |
| Endpoints en Novita AI | chat/completions, anthropic |
Para Claude Code, usa la familia de endpoints anthropic — eso es lo que espera el SDK de Anthropic.
¿Cuánto cuesta Kimi K2.7 Code en Novita AI?
| Tipo de token | Precio de Novita AI | Precio de Claude Sonnet 4.5 |
|---|---|---|
| Entrada | $0.95 / 1M | $3.00 / 1M |
| Entrada de lectura de caché | $0.19 / 1M | — |
| Salida | $4.00 / 1M | $15.00 / 1M |
Precios basados en la página del modelo Kimi K2.7 Code en Novita AI a junio de 2026. Novita AI también lista precios de lectura de caché, lo cual es importante para flujos de trabajo con contexto repetido como agentes que reutilizan el mismo prompt del sistema y esquema de herramientas en muchas llamadas.
Paso 1: Obtén tu clave API de Novita AI
Regístrate en una cuenta de Novita AI — las cuentas nuevas reciben créditos de prueba gratuitos.
Una vez que hayas iniciado sesión:
- Ve a Gestión de claves en tu panel de control.
- Haz clic en Crear nueva clave.
- Copia la clave inmediatamente y guárdala en un lugar seguro — solo se muestra una vez.
Usarás esta clave como ANTHROPIC_AUTH_TOKEN en el siguiente paso.
Paso 2: Instalar Claude Code
Claude Code requiere Node.js 18 o superior. Verifica tu versión primero:
node --version
Instala Claude Code globalmente:
npm install -g @anthropic-ai/claude-code
Verifica la instalación:
claude --version
Paso 3: Configurar variables de entorno
Claude Code lee cuatro variables de entorno para saber qué endpoint, clave API y modelo usar. Configúralas las cuatro — ANTHROPIC_SMALL_FAST_MODEL controla qué modelo usa Claude Code para subtareas ligeras como resúmenes y ediciones rápidas.
Mac y Linux
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="TU_CLAVE_API_DE_NOVITA"
export ANTHROPIC_MODEL="moonshotai/kimi-k2.7-code"
export ANTHROPIC_SMALL_FAST_MODEL="moonshotai/kimi-k2.7-code"
Para hacerlas permanentes, agrega las cuatro líneas a ~/.zshrc o ~/.bashrc, luego ejecuta source ~/.zshrc (o ~/.bashrc).
Windows (Command Prompt)
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=TU_CLAVE_API_DE_NOVITA
set ANTHROPIC_MODEL=moonshotai/kimi-k2.7-code
set ANTHROPIC_SMALL_FAST_MODEL=moonshotai/kimi-k2.7-code
Estas variables de entorno duran solo para la sesión actual. Para una configuración permanente en Windows, agrégalas a través de Propiedades del sistema → Variables de entorno.
Función de cada variable
| Variable | Valor | Propósito |
|---|---|---|
ANTHROPIC_BASE_URL |
https://api.novita.ai/anthropic |
Apunta Claude Code al endpoint compatible con Anthropic de Novita AI |
ANTHROPIC_AUTH_TOKEN |
Tu clave API de Novita | Autentica tus solicitudes |
ANTHROPIC_MODEL |
moonshotai/kimi-k2.7-code |
Establece el modelo principal para tareas de codificación |
ANTHROPIC_SMALL_FAST_MODEL |
moonshotai/kimi-k2.7-code |
Establece el modelo para subtareas ligeras |
Paso 4: Iniciar Claude Code
Navega hasta tu directorio del proyecto e inicia una sesión:
cd tu-directorio-del-proyecto
claude .
Claude Code abre un prompt interactivo. Ahora puedes describir tareas en lenguaje natural — implementar una función, corregir un error, refactorizar un módulo, escribir pruebas — y Kimi K2.7 Code maneja el razonamiento y la generación de código a través del endpoint de Novita AI.
Para verificar que el modelo se está enrutando correctamente, ejecuta /status dentro de la sesión de Claude Code. Debería mostrar la URL base y el modelo configurados.
Consejos prácticos para flujos de trabajo de codificación
Envía más contexto por adelantado. Con 256K tokens disponibles, puedes incluir el contenido completo de los archivos relevantes en lugar de solo extractos. Claude Code puede referenciar el código real en lugar de razonar a partir de resúmenes, lo que reduce las alucinaciones en los detalles de implementación.
Usa pensamiento intercalado para tareas complejas. Kimi K2.7 Code razona paso a paso antes de generar código. Para refactorizaciones de múltiples archivos o decisiones de arquitectura, dale al modelo suficiente contexto para ver el panorama completo — planificará antes de escribir, lo que reduce las correcciones posteriores.
Depuración multimodal. Kimi K2.7 Code acepta imágenes y video como entrada. Si tu flujo de trabajo incluye informes de errores con capturas de pantalla o tareas de revisión de interfaz de usuario, puedes enviarlos directamente a la sesión. Las respuestas siempre son texto, por lo que la salida es código, planes o análisis.
Prompts del sistema con mucho caché. Si usas un prompt del sistema consistente en muchas sesiones — estándares de codificación, convenciones del proyecto, notas de arquitectura — el precio de lectura de caché de Novita AI a $0.19 por millón de tokens se aplica al contenido repetido. Para equipos con prompts del sistema largos y estables, esto reduce significativamente el costo por tarea.
Mantente en un solo modelo para consistencia. Configurar tanto ANTHROPIC_MODEL como ANTHROPIC_SMALL_FAST_MODEL a moonshotai/kimi-k2.7-code mantiene un comportamiento consistente en la tarea principal y las subtareas. Si más adelante deseas un modelo más ligero para subtareas para ahorrar costos, puedes cambiar solo ANTHROPIC_SMALL_FAST_MODEL.
Solución de problemas
401 No autorizado
Tu clave API es incorrecta o ha expirado. Verifica la clave en Gestión de claves de Novita AI. Revisa si hay espacios adicionales o saltos de línea al copiar la clave.
Modelo no encontrado / 404
Confirma que el ID del modelo sea exactamente moonshotai/kimi-k2.7-code — sin espacios adicionales, con la capitalización correcta. Puedes verificarlo en la página del modelo Kimi K2.7 Code.
Respuestas lentas en prompts largos
Habilita el streaming de forma predeterminada en Claude Code — la mayoría de las configuraciones lo hacen automáticamente. Para entradas de contexto muy largas (100K+ tokens), la latencia de respuesta inicial aumenta. Considera recortar primero el contexto de baja prioridad.
Variables de entorno no detectadas
En Mac/Linux, confirma que hayas actualizado el archivo de perfil después de editarlo (source ~/.zshrc). En Windows, las variables de entorno configuradas con set duran solo para la sesión actual del Command Prompt — usa el panel de Propiedades del sistema para variables persistentes.
Preguntas frecuentes
¿Kimi K2.7 Code funciona con las herramientas y las integraciones MCP de Claude Code?
Sí. Kimi K2.7 Code admite llamada a funciones a través del endpoint compatible con Anthropic de Novita AI, que es lo que Claude Code utiliza para las llamadas a herramientas y las integraciones MCP.
¿Por qué usar el endpoint de Anthropic en lugar del compatible con OpenAI?
Claude Code está construido sobre el SDK de Anthropic. Se comunica utilizando el formato de mensajes de Anthropic, no el de OpenAI. El endpoint https://api.novita.ai/anthropic de Novita AI traduce ese formato, por lo que Claude Code funciona sin ninguna modificación.
¿Cómo se compara Kimi K2.7 Code con Kimi K2.5 para Claude Code?
Kimi K2.7 Code genera aproximadamente un 30% menos de tokens de pensamiento que K2.6 (y mejora la eficiencia de K2.5), manteniendo la calidad de codificación. Para sesiones de Claude Code con tareas repetitivas de múltiples pasos, menos tokens de pensamiento significan respuestas más rápidas y menor costo de tokens por tarea.
¿Puedo usar esta configuración en VS Code o Cursor?
Sí. Claude Code se integra con VS Code y Cursor a través de plugins y la terminal. Se aplica la misma configuración de variables de entorno — una vez configuradas, tanto las integraciones del IDE como la terminal independiente usan el modelo configurado.
Novita AI es una plataforma en la nube de IA que ofrece a los desarrolladores una forma sencilla de acceder a modelos de última generación a través de una API simple, con una infraestructura de GPU asequible y confiable.
