Cómo acceder a Kimi K2.5: Web, API, Claude Code, Autoalojamiento

Tabla de contenido

Introducción al modelo Kimi K2.5
Método de acceso 1: Novita AI Playground
Método de acceso 2: Acceso a la API de Novita AI (Para desarrolladores)
Método de acceso 3: Integración con herramientas de código
Método de acceso 4: Despliegue local
Requisitos de VRAM
Comparación de métodos de acceso
Conclusión
Preguntas frecuentes

Acceder a modelos de IA de última generación no debería requerir semanas de configuración de infraestructura. Kimi K2.5 está disponible a través de cuatro vías: playground web (sin configuración), API de Novita AI (3 líneas de código), integración con herramientas de código (Claude Code, Cursor, Continue) y despliegue local (infraestructura de 375 GB+).

Esta guía cubre todos los métodos de acceso —desde el más simple hasta el más avanzado— con tiempos de configuración que van desde aproximadamente 30 segundos (acceso web) hasta varios días (autoalojamiento). El acceso por API, con un precio de $0.60 / $3.00 por 1M de tokens, proporciona un rendimiento de nivel de producción sin la sobrecarga operativa de gestionar clústeres de GPU.

Introducción al modelo Kimi K2.5

Novedades de Kimi K2.5

Kimi K2.5 introduce un modo Agent Swarm que coordina hasta 100 subagentes especializados que ejecutan flujos de trabajo en paralelo. Al generar dinámicamente agentes para tareas concurrentes, logra una ejecución hasta 4.5× más rápida en comparación con el procesamiento secuencial. El modelo también mantiene un rendimiento estable a lo largo de 200–300 llamadas secuenciales a herramientas sin desviación, abordando un punto de fallo común en el que muchos modelos pierden coherencia durante sesiones agentivas largas.

De Kimi

Especificaciones principales


Desarrollador	Moonshot AI
Parámetros	1 billón total, 32B activos (arquitectura MoE)
Ventana de contexto	256K tokens
Modalidades	Texto, Visión
Modos de operación	Instantáneo (3-8s), Pensamiento (trazas de razonamiento), Agente (búsqueda/código/web), Agent Swarm (coordinación paralela)

Rendimiento en benchmarks

En general, Kimi K2.5 es particularmente fuerte en:

Búsqueda agentiva e investigación autónoma

Razonamiento matemático

Tareas de visión basadas en documentos/OCR

Comprensión multimodal de video largo

Categoría	Benchmark	Kimi K2.5	GPT-5.2
Razonamiento	HLE-Full	30.1	34.5
	HLE-Full (con herramientas)	50.2	45.5
	AIME 2025	96.1	100
	HMMT 2025	95.4	99.4
	IMO-AnswerBench	81.8	86.3
	GPQA-Diamond	87.6	92.4
	MMLU-Pro	87.1	86.7
Visión / Multimodal	MMMU-Pro	78.5	79.5
	MathVision	84.2	83.0
	MathVista	90.1	82.8
	OCRBench	92.3	80.7
	InfoVQA	92.6	84.0
	SimpleVQA	71.2	55.8
Comprensión de video	VideoMMMU	86.6	85.9
	MotionBench	70.4	64.8
	LongVideoBench	79.8	76.5
Codificación	SWE-Bench Verified	76.8	80.0
	SWE-Bench Pro	50.7	55.6
	TerminalBench	50.8	54.0
	LiveCodeBench	85.0	—
Búsqueda agentiva	BrowseComp	60.6	65.8
	BrowseComp (Agent Swarm)	78.4	—
	DeepSearchQA	77.1	71.3

¡Prueba Kimi K2.5 ahora!

Método de acceso 1: Novita AI Playground

El Playground de Novita proporciona una forma sencilla de explorar y usar Kimi K2.5 sin sobrecarga de configuración. Puedes interactuar con el modelo directamente en una interfaz de chat o finalización, ajustar parámetros como temperatura y max tokens en tiempo real, y observar inmediatamente cómo cambian las salidas. Te permite probar prompts, refinar instrucciones del sistema y evaluar la calidad de las respuestas antes de integrarlo en tu aplicación.

¡Prueba Kimi K2.5 ahora!

Método de acceso 2: Acceso a la API de Novita AI (Para desarrolladores)

Acceso programático de nivel de producción con endpoints compatibles con OpenAI. Novita AI proporciona acceso API instantáneo a Kimi K2.5 a $0.60 por 1M de tokens de entrada y $3.00 por 1M de tokens de salida — un 76% más barato que Claude Opus 4.5 para tareas de razonamiento equivalentes. El endpoint compatible con OpenAI significa que tu código existente solo requiere dos cambios de configuración: la URL base y la clave API.

¡Prueba Kimi K2.5 ahora!

Obtén tu clave API

Crea una cuenta en novita.ai
Navega a Gestión de claves
Genera una nueva clave API (mantenla segura — trátala como una contraseña)

Integra con la API

Instala el SDK de OpenAI y conéctate al endpoint de Novita:

pip install openai

from openai import OpenAI

client = OpenAI(
    api_key="<Tu clave API>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.5",
    messages=[
        {"role": "system", "content": "Eres un asistente útil."},
        {"role": "user", "content": "Hola, ¿cómo estás?"}
    ],
    max_tokens=262144,
    temperature=0.7
)

print(response.choices[0].message.content)

Método de acceso 3: Integración con herramientas de código

Integra Kimi K2.5 en tu entorno de desarrollo para flujos de trabajo de codificación agentivos. Estas herramientas proporcionan automatización de terminal, integración con IDE y capacidades de ejecución de tareas de varios pasos que aprovechan la estabilidad extendida de llamadas a herramientas de Kimi.

Conecta fácilmente Novita AI con plataformas asociadas como Trae, Continue, Codex, OpenCode, AnythingLLM ,LangChain, Dif y, Langflow y Openclaw a través de integraciones oficiales y guías paso a paso.

Claude Code

Ideal para: Flujos de trabajo basados en terminal, operaciones Git, tareas del sistema de archivos y desarrolladores que prefieren el desarrollo controlado por teclado.

Claude Code es el agente CLI oficial de Anthropic. Aunque está diseñado para modelos Claude, admite endpoints de modelo personalizados mediante variables de entorno. La configuración toma 2 minutos:

# Instalar Claude Code
npm install -g @anthropic-ai/claude-code

# Configurar para Kimi K2.5 a través de Novita
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="TU_CLAVE_API_NOVITA"
export ANTHROPIC_MODEL="moonshotai/kimi-k2.5"
export ANTHROPIC_SMALL_FAST_MODEL="moonshotai/kimi-k2.5"

# Iniciar una sesión en tu directorio de proyecto
cd ~/mi-proyecto
claude .

Guía completa de configuración: Integración de Claude Code con Novita AI

Cursor

Ideal para: Edición de múltiples archivos, contexto consciente del código, desarrollo basado en GUI y desarrolladores que quieren la familiaridad de VS Code con superpoderes de IA.

Cursor es un fork de VS Code construido para el desarrollo nativo con IA. Pasos de integración:

Descarga Cursor desde cursor.sh
Abre Configuración → Modelos
Desmarca los modelos predeterminados
Añade modelo personalizado:
- Proveedor: Compatible con OpenAI
- URL base: https://api.novita.ai/v3/openai
- Clave API: Tu clave API de Novita
- Nombre del modelo: moonshotai/kimi-k2.5
Usa las funciones Cmd+K (edición en línea), Cmd+L (chat) o Composer (varios archivos)

Guía completa de configuración: Integración de Cursor con Novita AI

NovitaClaw CLI

Requisitos previos

Python instalado
Una clave API de Novita — así es como obtener una:
- Inicia sesión en novita.ai — accede con Google o GitHub (se crea automáticamente una nueva cuenta en el primer inicio de sesión), o regístrate con tu correo electrónico
- Crea una clave API — ve a la página de configuración de Gestión de claves para crear o gestionar tus claves API. Cópiala en un lugar seguro — la necesitarás en el siguiente paso.

Cómo instalar Python

Windows

Descarga el instalador de Python
Ejecuta el instalador — marca “Add Python to PATH” antes de hacer clic en cualquier otra cosa. Saltarse esto es la razón más común por la que los principiantes encuentran errores más tarde
Haz clic en Install Now y espera el mensaje “Setup was successful”

macOS

Abre Terminal (Command + Space, busca “Terminal”) y ejecuta:

python3 --version

Si ves Python 3.10 o superior, estás listo. Si la versión es anterior, o Terminal te pide que instales Command Line Developer Tools, haz clic en Install y espera unos minutos antes de continuar.

Linux (Ubuntu / Debian)

Si estás en una distro basada en Debian, ejecuta:

sudo apt update && sudo apt install python3 python3-pip -y

#### Instalar y lanzar

Paso 1: Instalar NovitaClaw

macOS / Linux:

sudo pip3 install novitaclaw

Windows PowerShell:

pip install novitaclaw

Si tienes una versión anterior instalada, actualiza a la última versión:

Bash

pip3 install novitaclaw --upgrade

Si la actualización falla, prueba con una reinstalación forzada:

Bash

pip3 install novitaclaw --upgrade --force-reinstall

Después de la instalación, verifícalo escribiendo novitaclaw --help. Si ves una lista de instrucciones, ¡lo has logrado!

Nota especial para usuarios de Mac

Si después de la instalación recibes un error zsh: command not found: novitaclaw, ejecuta estos dos comandos en orden para corregir la ruta de tu entorno:

source ~/.zshrc

echo 'export PATH="'$(python3 -m site --user-base)'/bin:$PATH"' >> ~/.zshrc

#### Paso 2: Configurar la variable de entorno en tu terminal

macOS / Linux:

export NOVITA_API_KEY=sk_tu_clave_api

Windows PowerShell:

$env:NOVITA_API_KEY = "sk_tu_clave_api"

Paso 3: Lanzar instancia

novitaclaw launch

En caso de éxito, el CLI devuelve tres valores que usarás para acceder y gestionar tu agente:

URL de la interfaz web
URL del WebSocket de Gateway y Token
URL de la terminal web (para acceso terminal al sandbox)
URL del administrador de archivos (para navegar y gestionar los archivos del espacio de trabajo)
Credenciales de inicio de sesión (para la terminal web y el administrador de archivos)

Abre la URL de la interfaz web devuelta y ve a la pestaña Chat para usar tu agente. Usa la URL de la Terminal web para abrir una sesión de terminal dentro del sandbox, y la URL del Administrador de archivos para navegar y gestionar archivos en el espacio de trabajo del sandbox.

Guía completa de configuración: Integración de NovitaClaw

Método de acceso 4: Despliegue local

El autoalojamiento requiere una infraestructura significativa. Kimi K2.5 es un modelo de mezcla de expertos con 1 billón de parámetros y 32B de parámetros activos.

Requisitos de VRAM

Basado en datos de cuantización GGUF de Unsloth:

Cuantización	Tamaño de archivo	Impacto en la calidad
Q2_K	373.8 GB	Pérdida significativa de calidad
Q4_K_M	621.2 GB	Pérdida moderada de calidad, aceptable para pruebas
Q6_K	842.9 GB	Pérdida mínima de calidad
BF16	2053.2 GB	Precisión completa

Comparación de métodos de acceso

Método	Tiempo de configuración	Costo	Ideal para
Playground web	30 segundos	Gratuito (con límites)	Evaluación rápida, pruebas de Agent Swarm, prototipos no productivos
API de Novita AI	5 minutos	$0.60/$3.00 por 1M de tokens	Aplicaciones de producción, cargas de trabajo variables, proyectos sensibles al costo
Herramientas de código	10-15 minutos	Gratuito + costos de API	Desarrolladores que quieren integración IDE/terminal para flujos de trabajo agentivos
Despliegue local	Varios días	Hardware de $5,000-15,000 + electricidad	Empresas con 2B+ tokens/mes, requisitos estrictos de residencia de datos

Las cuatro vías de acceso de Kimi K2.5 sirven para diferentes contextos de despliegue. Explora las capacidades a través del playground web → construye aplicaciones con la API de Novita → intégrate con herramientas de código para flujos de trabajo de desarrollo. Autoalójate solo si tienes cargas de trabajo a escala empresarial y mandatos estrictos de residencia de datos.

Conclusión

Kimi K2.5 ofrece cuatro rutas de acceso flexibles para adaptarse a cualquier flujo de trabajo. Comienza con el playground web para una evaluación sin configuración, pasa a la API de Novita AI para una integración de nivel de producción a $0.60/1M de tokens de entrada, conéctate a Claude Code o Cursor para el desarrollo asistido por IA, o autoalójate para un control total de los datos. Para la mayoría de los desarrolladores, la ruta de la API ofrece el mejor equilibrio entre rendimiento, costo y confiabilidad sin sobrecarga de infraestructura.

Conclusión clave: Usa la API de Novita AI para el camino más rápido hacia la producción — endpoints compatibles con OpenAI, sin gestión de GPU y precios competitivos. Comienza con Kimi K2.5 en Novita AI.

Preguntas frecuentes

¿Cuánto cuesta el acceso a la API de Kimi K2.5?

Novita AI cobra $0.60 por 1M de tokens de entrada y $3.00 por 1M de tokens de salida — un 76% más barato que Claude Opus 4.5 para tareas de razonamiento equivalentes.

¿Está disponible el modo Agent Swarm a través de la API?

No. Agent Swarm (coordinación paralela de 100 agentes) actualmente requiere prompts de sistema personalizados que solo están disponibles en kimi.com. Los endpoints API estándar proporcionan capacidades base; replicar el comportamiento de Agent Swarm requiere ingeniería de prompts.

¿Debería autoalojar Kimi K2.5 o usar una API?

El autoalojamiento requiere una infraestructura significativa. Kimi K2.5 es un modelo de mezcla de expertos con 1 billón de parámetros y 32B de parámetros activos. Con la cuantización mínima (Q2_K), necesitas ~374 GB de almacenamiento y múltiples GPU de gama alta. Para la mayoría de los desarrolladores, el acceso a la API de Novita AI proporciona las mismas capacidades a $0.60/1M de tokens de entrada sin gestionar clústeres de GPU. Autoalójate solo si tienes cargas de trabajo a escala empresarial y requisitos estrictos de residencia de datos.

Novita AI es una plataforma en la nube de IA y agentes que ayuda a desarrolladores y startups a construir, desplegar y escalar modelos y aplicaciones agentivas con alto rendimiento, confiabilidad y eficiencia de costos.

Lecturas recomendadas

Cómo acceder a Kimi K2.5: Web, API, Claude Code, Autoalojamiento

Introducción al modelo Kimi K2.5

Novedades de Kimi K2.5

Especificaciones principales

Rendimiento en benchmarks

Método de acceso 1: Novita AI Playground

Método de acceso 2: Acceso a la API de Novita AI (Para desarrolladores)

Obtén tu clave API

Integra con la API

Método de acceso 3: Integración con herramientas de código

Claude Code

Cursor

NovitaClaw CLI

Requisitos previos

macOS

Linux (Ubuntu / Debian)

Paso 1: Instalar NovitaClaw

Paso 3: Lanzar instancia

Método de acceso 4: Despliegue local

Requisitos de VRAM

Comparación de métodos de acceso

Conclusión

Preguntas frecuentes

Product

RESOURCES

Partners

Company

Introducción al modelo Kimi K2.5

Novedades de Kimi K2.5

Especificaciones principales

Rendimiento en benchmarks

Método de acceso 1: Novita AI Playground

Método de acceso 2: Acceso a la API de Novita AI (Para desarrolladores)

Obtén tu clave API

Integra con la API

Método de acceso 3: Integración con herramientas de código

Claude Code

Cursor

NovitaClaw CLI

Requisitos previos

macOS

Linux (Ubuntu / Debian)

Paso 1: Instalar NovitaClaw

Paso 3: Lanzar instancia

Método de acceso 4: Despliegue local

Requisitos de VRAM

Comparación de métodos de acceso

Conclusión

Preguntas frecuentes

Publicaciones relacionadas

Product

RESOURCES

Partners

Company