- Introducción al modelo Kimi K2.5
- Método de acceso 1: Novita AI Playground
- Método de acceso 2: Acceso a la API de Novita AI (Para desarrolladores)
- Método de acceso 3: Integración con herramientas de código
- Método de acceso 4: Despliegue local
- Requisitos de VRAM
- Comparación de métodos de acceso
- Conclusión
- Preguntas frecuentes
Acceder a modelos de IA de última generación no debería requerir semanas de configuración de infraestructura. Kimi K2.5 está disponible a través de cuatro vías: playground web (sin configuración), API de Novita AI (3 líneas de código), integración con herramientas de código (Claude Code, Cursor, Continue) y despliegue local (infraestructura de 375 GB+).
Esta guía cubre todos los métodos de acceso —desde el más simple hasta el más avanzado— con tiempos de configuración que van desde aproximadamente 30 segundos (acceso web) hasta varios días (autoalojamiento). El acceso por API, con un precio de $0.60 / $3.00 por 1M de tokens, proporciona un rendimiento de nivel de producción sin la sobrecarga operativa de gestionar clústeres de GPU.
Introducción al modelo Kimi K2.5
Novedades de Kimi K2.5
Kimi K2.5 introduce un modo Agent Swarm que coordina hasta 100 subagentes especializados que ejecutan flujos de trabajo en paralelo. Al generar dinámicamente agentes para tareas concurrentes, logra una ejecución hasta 4.5× más rápida en comparación con el procesamiento secuencial. El modelo también mantiene un rendimiento estable a lo largo de 200–300 llamadas secuenciales a herramientas sin desviación, abordando un punto de fallo común en el que muchos modelos pierden coherencia durante sesiones agentivas largas.

De Kimi
Especificaciones principales
| Desarrollador | Moonshot AI |
| Parámetros | 1 billón total, 32B activos (arquitectura MoE) |
| Ventana de contexto | 256K tokens |
| Modalidades | Texto, Visión |
| Modos de operación | Instantáneo (3-8s), Pensamiento (trazas de razonamiento), Agente (búsqueda/código/web), Agent Swarm (coordinación paralela) |
Rendimiento en benchmarks
En general, Kimi K2.5 es particularmente fuerte en:
- Búsqueda agentiva e investigación autónoma
- Razonamiento matemático
- Tareas de visión basadas en documentos/OCR
- Comprensión multimodal de video largo
| Categoría | Benchmark | Kimi K2.5 | GPT-5.2 |
|---|---|---|---|
| Razonamiento | HLE-Full | 30.1 | 34.5 |
| HLE-Full (con herramientas) | 50.2 | 45.5 | |
| AIME 2025 | 96.1 | 100 | |
| HMMT 2025 | 95.4 | 99.4 | |
| IMO-AnswerBench | 81.8 | 86.3 | |
| GPQA-Diamond | 87.6 | 92.4 | |
| MMLU-Pro | 87.1 | 86.7 | |
| Visión / Multimodal | MMMU-Pro | 78.5 | 79.5 |
| MathVision | 84.2 | 83.0 | |
| MathVista | 90.1 | 82.8 | |
| OCRBench | 92.3 | 80.7 | |
| InfoVQA | 92.6 | 84.0 | |
| SimpleVQA | 71.2 | 55.8 | |
| Comprensión de video | VideoMMMU | 86.6 | 85.9 |
| MotionBench | 70.4 | 64.8 | |
| LongVideoBench | 79.8 | 76.5 | |
| Codificación | SWE-Bench Verified | 76.8 | 80.0 |
| SWE-Bench Pro | 50.7 | 55.6 | |
| TerminalBench | 50.8 | 54.0 | |
| LiveCodeBench | 85.0 | — | |
| Búsqueda agentiva | BrowseComp | 60.6 | 65.8 |
| BrowseComp (Agent Swarm) | 78.4 | — | |
| DeepSearchQA | 77.1 | 71.3 |
Método de acceso 1: Novita AI Playground
El Playground de Novita proporciona una forma sencilla de explorar y usar Kimi K2.5 sin sobrecarga de configuración. Puedes interactuar con el modelo directamente en una interfaz de chat o finalización, ajustar parámetros como temperatura y max tokens en tiempo real, y observar inmediatamente cómo cambian las salidas. Te permite probar prompts, refinar instrucciones del sistema y evaluar la calidad de las respuestas antes de integrarlo en tu aplicación.

Método de acceso 2: Acceso a la API de Novita AI (Para desarrolladores)
Acceso programático de nivel de producción con endpoints compatibles con OpenAI. Novita AI proporciona acceso API instantáneo a Kimi K2.5 a $0.60 por 1M de tokens de entrada y $3.00 por 1M de tokens de salida — un 76% más barato que Claude Opus 4.5 para tareas de razonamiento equivalentes. El endpoint compatible con OpenAI significa que tu código existente solo requiere dos cambios de configuración: la URL base y la clave API.

Obtén tu clave API
- Crea una cuenta en novita.ai
- Navega a Gestión de claves
- Genera una nueva clave API (mantenla segura — trátala como una contraseña)
Integra con la API
Instala el SDK de OpenAI y conéctate al endpoint de Novita:
pip install openai
from openai import OpenAI
client = OpenAI(
api_key="<Tu clave API>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.5",
messages=[
{"role": "system", "content": "Eres un asistente útil."},
{"role": "user", "content": "Hola, ¿cómo estás?"}
],
max_tokens=262144,
temperature=0.7
)
print(response.choices[0].message.content)
Método de acceso 3: Integración con herramientas de código
Integra Kimi K2.5 en tu entorno de desarrollo para flujos de trabajo de codificación agentivos. Estas herramientas proporcionan automatización de terminal, integración con IDE y capacidades de ejecución de tareas de varios pasos que aprovechan la estabilidad extendida de llamadas a herramientas de Kimi.
Conecta fácilmente Novita AI con plataformas asociadas como Trae, Continue, Codex, OpenCode, AnythingLLM,LangChain, Dify, Langflow y Openclaw a través de integraciones oficiales y guías paso a paso.
Claude Code
Ideal para: Flujos de trabajo basados en terminal, operaciones Git, tareas del sistema de archivos y desarrolladores que prefieren el desarrollo controlado por teclado.
Claude Code es el agente CLI oficial de Anthropic. Aunque está diseñado para modelos Claude, admite endpoints de modelo personalizados mediante variables de entorno. La configuración toma 2 minutos:
# Instalar Claude Code
npm install -g @anthropic-ai/claude-code
# Configurar para Kimi K2.5 a través de Novita
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="TU_CLAVE_API_NOVITA"
export ANTHROPIC_MODEL="moonshotai/kimi-k2.5"
export ANTHROPIC_SMALL_FAST_MODEL="moonshotai/kimi-k2.5"
# Iniciar una sesión en tu directorio de proyecto
cd ~/mi-proyecto
claude .
Guía completa de configuración: Integración de Claude Code con Novita AI
Cursor
Ideal para: Edición de múltiples archivos, contexto consciente del código, desarrollo basado en GUI y desarrolladores que quieren la familiaridad de VS Code con superpoderes de IA.
Cursor es un fork de VS Code construido para el desarrollo nativo con IA. Pasos de integración:
- Descarga Cursor desde cursor.sh
- Abre Configuración → Modelos
- Desmarca los modelos predeterminados
- Añade modelo personalizado:
- Proveedor: Compatible con OpenAI
- URL base:
https://api.novita.ai/v3/openai - Clave API: Tu clave API de Novita
- Nombre del modelo:
moonshotai/kimi-k2.5
- Usa las funciones Cmd+K (edición en línea), Cmd+L (chat) o Composer (varios archivos)
Guía completa de configuración: Integración de Cursor con Novita AI
NovitaClaw CLI
Requisitos previos
- Python instalado
- Una clave API de Novita — así es como obtener una:
- Inicia sesión en novita.ai — accede con Google o GitHub (se crea automáticamente una nueva cuenta en el primer inicio de sesión), o regístrate con tu correo electrónico
- Crea una clave API — ve a la página de configuración de Gestión de claves para crear o gestionar tus claves API. Cópiala en un lugar seguro — la necesitarás en el siguiente paso.
Cómo instalar Python
Windows
- Descarga el instalador de Python
- Ejecuta el instalador — marca “Add Python to PATH” antes de hacer clic en cualquier otra cosa. Saltarse esto es la razón más común por la que los principiantes encuentran errores más tarde
- Haz clic en Install Now y espera el mensaje “Setup was successful”
macOS
Abre Terminal (Command + Space, busca “Terminal”) y ejecuta:
python3 --version
Si ves Python 3.10 o superior, estás listo. Si la versión es anterior, o Terminal te pide que instales Command Line Developer Tools, haz clic en Install y espera unos minutos antes de continuar.
Linux (Ubuntu / Debian)
Si estás en una distro basada en Debian, ejecuta:
sudo apt update && sudo apt install python3 python3-pip -y
Paso 1: Instalar NovitaClaw
macOS / Linux:
sudo pip3 install novitaclaw
Windows PowerShell:
pip install novitaclaw
Si tienes una versión anterior instalada, actualiza a la última versión:
Bash
pip3 install novitaclaw --upgrade
Si la actualización falla, prueba con una reinstalación forzada:
Bash
pip3 install novitaclaw --upgrade --force-reinstall
Después de la instalación, verifícalo escribiendo novitaclaw --help. Si ves una lista de instrucciones, ¡lo has logrado!

Nota especial para usuarios de Mac
Si después de la instalación recibes un error zsh: command not found: novitaclaw, ejecuta estos dos comandos en orden para corregir la ruta de tu entorno:
source ~/.zshrc
echo 'export PATH="'$(python3 -m site --user-base)'/bin:$PATH"' >> ~/.zshrc
macOS / Linux:
export NOVITA_API_KEY=sk_tu_clave_api
Windows PowerShell:
$env:NOVITA_API_KEY = "sk_tu_clave_api"
Paso 3: Lanzar instancia
novitaclaw launch
En caso de éxito, el CLI devuelve tres valores que usarás para acceder y gestionar tu agente:
- URL de la interfaz web
- URL del WebSocket de Gateway y Token
- URL de la terminal web (para acceso terminal al sandbox)
- URL del administrador de archivos (para navegar y gestionar los archivos del espacio de trabajo)
- Credenciales de inicio de sesión (para la terminal web y el administrador de archivos)

Abre la URL de la interfaz web devuelta y ve a la pestaña Chat para usar tu agente. Usa la URL de la Terminal web para abrir una sesión de terminal dentro del sandbox, y la URL del Administrador de archivos para navegar y gestionar archivos en el espacio de trabajo del sandbox.
Guía completa de configuración: Integración de NovitaClaw
Método de acceso 4: Despliegue local
El autoalojamiento requiere una infraestructura significativa. Kimi K2.5 es un modelo de mezcla de expertos con 1 billón de parámetros y 32B de parámetros activos.
Requisitos de VRAM
Basado en datos de cuantización GGUF de Unsloth:
| Cuantización | Tamaño de archivo | Impacto en la calidad |
|---|---|---|
| Q2_K | 373.8 GB | Pérdida significativa de calidad |
| Q4_K_M | 621.2 GB | Pérdida moderada de calidad, aceptable para pruebas |
| Q6_K | 842.9 GB | Pérdida mínima de calidad |
| BF16 | 2053.2 GB | Precisión completa |
Comparación de métodos de acceso
| Método | Tiempo de configuración | Costo | Ideal para |
|---|---|---|---|
| Playground web | 30 segundos | Gratuito (con límites) | Evaluación rápida, pruebas de Agent Swarm, prototipos no productivos |
| API de Novita AI | 5 minutos | $0.60/$3.00 por 1M de tokens | Aplicaciones de producción, cargas de trabajo variables, proyectos sensibles al costo |
| Herramientas de código | 10-15 minutos | Gratuito + costos de API | Desarrolladores que quieren integración IDE/terminal para flujos de trabajo agentivos |
| Despliegue local | Varios días | Hardware de $5,000-15,000 + electricidad | Empresas con 2B+ tokens/mes, requisitos estrictos de residencia de datos |
Las cuatro vías de acceso de Kimi K2.5 sirven para diferentes contextos de despliegue. Explora las capacidades a través del playground web → construye aplicaciones con la API de Novita → intégrate con herramientas de código para flujos de trabajo de desarrollo. Autoalójate solo si tienes cargas de trabajo a escala empresarial y mandatos estrictos de residencia de datos.
Conclusión
Kimi K2.5 ofrece cuatro rutas de acceso flexibles para adaptarse a cualquier flujo de trabajo. Comienza con el playground web para una evaluación sin configuración, pasa a la API de Novita AI para una integración de nivel de producción a $0.60/1M de tokens de entrada, conéctate a Claude Code o Cursor para el desarrollo asistido por IA, o autoalójate para un control total de los datos. Para la mayoría de los desarrolladores, la ruta de la API ofrece el mejor equilibrio entre rendimiento, costo y confiabilidad sin sobrecarga de infraestructura.
Conclusión clave: Usa la API de Novita AI para el camino más rápido hacia la producción — endpoints compatibles con OpenAI, sin gestión de GPU y precios competitivos. Comienza con Kimi K2.5 en Novita AI.
Preguntas frecuentes
¿Cuánto cuesta el acceso a la API de Kimi K2.5?
Novita AI cobra $0.60 por 1M de tokens de entrada y $3.00 por 1M de tokens de salida — un 76% más barato que Claude Opus 4.5 para tareas de razonamiento equivalentes.
¿Está disponible el modo Agent Swarm a través de la API?
No. Agent Swarm (coordinación paralela de 100 agentes) actualmente requiere prompts de sistema personalizados que solo están disponibles en kimi.com. Los endpoints API estándar proporcionan capacidades base; replicar el comportamiento de Agent Swarm requiere ingeniería de prompts.
¿Debería autoalojar Kimi K2.5 o usar una API?
El autoalojamiento requiere una infraestructura significativa. Kimi K2.5 es un modelo de mezcla de expertos con 1 billón de parámetros y 32B de parámetros activos. Con la cuantización mínima (Q2_K), necesitas ~374 GB de almacenamiento y múltiples GPU de gama alta. Para la mayoría de los desarrolladores, el acceso a la API de Novita AI proporciona las mismas capacidades a $0.60/1M de tokens de entrada sin gestionar clústeres de GPU. Autoalójate solo si tienes cargas de trabajo a escala empresarial y requisitos estrictos de residencia de datos.
Novita AI es una plataforma en la nube de IA y agentes que ayuda a desarrolladores y startups a construir, desplegar y escalar modelos y aplicaciones agentivas con alto rendimiento, confiabilidad y eficiencia de costos.
Lecturas recomendadas
