Aspectos destacados
Novita AI ha presentado DeepSeek R1 Turbo, que ofrece 3 veces el rendimiento y un 60% de descuento por tiempo limitado. Además, esta versión es compatible completamente con function calling.
¡Puedes iniciar una prueba gratuita en Novita AI!

Aún más emocionante: Novita AI ocupa el puesto 1 para la API de DeepSeek R1 en OpenRouter

¡Prueba el demo de DeepSeek R1 ahora!
¿Qué es DeepSeek R1?
- Fecha de lanzamiento: 21 de enero de 2025
- Escala del modelo:
- Características clave:
- Tamaño del modelo: 671B parámetros (37B activos/token)
- Tokenizador: Tokenizador mejorado con etiquetas de autorreflexión
- Idiomas compatibles: Multilingüe con adaptación cultural
- Multimodal: Solo texto
- Ventana de contexto: 128K tokens
- Formatos de almacenamiento: Soporte de cuantización Q8/Q5
- Arquitectura: Mezcla de expertos (MoE) + pipeline de entrenamiento mejorado con RL
- Método de entrenamiento: Construido sobre la base V3 con pipeline RL (SFT → RL → SFT → RL)
- Datos de entrenamiento: Base V3 + datos de optimización RL

Benchmark

DeepSeek-R1 demuestra mejoras significativas en el rendimiento en la mayoría de las tareas, especialmente logrando un aumento del 9.0% y 5.7% en las tareas de Codeforces y GPQA Diamond, respectivamente, mostrando su gran capacidad para manejar tareas complejas.
Requisitos de hardware para DeepSeek R1
| Modelo | Precisión | GPU | Cantidad |
|---|---|---|---|
| DeepSeek-R1-Distill-Qwen-1.5B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-7B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Llama-8B | BF16 | RTX 4090 | 1 |
| DeepSeek-R1-Distill-Qwen-14B | BF16 | RTX 4090 | 2 |
| DeepSeek-R1-Distill-Qwen-32B | BF16 | RTX 4090 | 4 |
| DeepSeek-R1-Distill-Llama-70B | BF16 | RTX 4090 | 8 |
| DeepSeek-R1 (671B) | BF16 | H100 | 8 |
Los requisitos de hardware de DeepSeek-R1 están claramente estratificados:
- Modelos destilados tienen requisitos de hardware relativamente bajos, especialmente para escalas pequeñas y medianas, lo que los hace adecuados para hardware de consumo de gama alta (por ejemplo, RTX 4090).
- Modelos a escala completa tienen requisitos de hardware extremadamente altos, especialmente los modelos ultragrandes, que dependen de hardware de nivel profesional (por ejemplo, GPUs H100).
- En general, la tecnología de destilación reduce significativamente los requisitos de hardware y mejora la flexibilidad del despliegue de modelos, pero los modelos a escala completa aún requieren hardware de muy alto rendimiento para alcanzar su máximo potencial.
Si comprar GPUs o desplegarlas por tu cuenta te resulta demasiado complicado, puedes utilizar los servicios de GPU y API de Novita AI, que ofrecen una versión totalmente optimizada de DeepSeek-R1. Es extremadamente conveniente y cobra según la cantidad de tokens.
Elegir Novita AI para servicios de GPU en la nube
Novita AI es una plataforma en la nube de IA que ofrece a los desarrolladores una forma sencilla de desplegar modelos de IA mediante nuestra API simple, al mismo tiempo que proporciona la GPU en la nube asequible y confiable para construir y escalar.
Paso 1: Registrarse
Si eres nuevo en Novita AI, comienza creando una cuenta en nuestro sitio web. Una vez registrado, dirígete a la pestaña “GPUs” para explorar los recursos disponibles y comenzar tu viaje.

Paso 2: Explorar plantillas y servidores GPU
Comienza seleccionando una plantilla que se ajuste a las necesidades de tu proyecto, como PyTorch, TensorFlow o CUDA. Elige la versión que se adapte a tus requisitos, como PyTorch 2.2.1 o CUDA 11.8.0. Luego, selecciona la configuración del servidor GPU A100, que ofrece un rendimiento potente para manejar cargas de trabajo exigentes con suficiente VRAM, RAM y capacidad de disco.

Prueba las GPUs de alto rendimiento de Novita AI
Paso 3: Personalizar tu despliegue
Después de seleccionar una plantilla y una GPU, personaliza la configuración de despliegue ajustando parámetros como la versión del sistema operativo (por ejemplo, CUDA 11.8). También puedes modificar otras configuraciones para adaptar el entorno a los requisitos específicos de tu proyecto.

Paso 4: Iniciar una instancia
Una vez que hayas finalizado la plantilla y la configuración de despliegue, haz clic en “Launch Instance” para configurar tu instancia GPU. Esto iniciará la configuración del entorno, permitiéndote comenzar a usar los recursos de GPU para tus tareas de IA.

Elegir Novita AI para servicios de API
Novita AI es una plataforma en la nube de IA que ofrece a los desarrolladores una forma sencilla de desplegar modelos de IA mediante nuestra API simple, al mismo tiempo que proporciona la GPU en la nube asequible y confiable para construir y escalar.
Paso 1: Iniciar sesión y acceder a la biblioteca de modelos
Inicia sesión en tu cuenta y haz clic en el botón Model Library.

¡Prueba el demo de DeepSeek R1 ahora!
Paso 2: Elegir tu modelo
Explora las opciones disponibles y selecciona el modelo que se adapte a tus necesidades.

Paso 3: Iniciar tu prueba gratuita
Comienza tu prueba gratuita para explorar las capacidades del modelo seleccionado.

Paso 4: Obtener tu clave API
Para autenticarte con la API, te proporcionaremos una nueva clave API. Entrando a la página “Settings”, puedes copiar la clave API como se indica en la imagen.

Paso 5: Instalar la API
Instala la API usando el gestor de paquetes específico de tu lenguaje de programación.

Después de la instalación, importa las bibliotecas necesarias en tu entorno de desarrollo. Inicializa la API con tu clave API para empezar a interactuar con Novita AI LLM. Este es un ejemplo de uso de la API de chat completions para usuarios de Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Novita AI revoluciona el despliegue de IA con DeepSeek R1 Turbo, ofreciendo 3 veces el rendimiento y soporte para funciones avanzadas como function calling, ahora disponible con un 20% de descuento por tiempo limitado. Ya sea que estés ejecutando modelos destilados en GPUs de consumo como RTX 4090 o desplegando modelos a escala completa con GPUs empresariales H100, Novita AI proporciona una flexibilidad inigualable. Para aquellos que buscan una solución sin complicaciones, los servicios de GPU y API de Novita AI ofrecen una versión totalmente optimizada de DeepSeek R1 Turbo, combinada con precios basados en tokens y una prueba gratuita. Experimenta el rendimiento de IA de siguiente nivel con DeepSeek R1 Turbo—¡comienza con Novita AI hoy!
Preguntas frecuentes
¿Qué es DeepSeek R1 Turbo?
DeepSeek R1 Turbo es una versión optimizada de DeepSeek R1, que ofrece 3 veces el rendimiento, soporte completo para function calling y un 20% de descuento por tiempo limitado en Novita AI.
¿Qué hardware se necesita para ejecutar DeepSeek R1?
Modelos a escala completa: Requieren GPUs empresariales como H100 para un rendimiento óptimo.
¿Puedo probar DeepSeek R1 gratis?
Sí, Novita AI ofrece una prueba gratuita de DeepSeek R1 a través de su plataforma API.
Novita AI es la plataforma integral en la nube que impulsa tus ambiciones de IA. APIs integradas, sin servidor, instancia GPU — las herramientas rentables que necesitas. Elimina la infraestructura, comienza gratis y haz realidad tu visión de IA.
