DeepSeek ha lanzado dos modelos innovadores — DeepSeek-R1-0528 y DeepSeek-R1-0528-Qwen3-8B — ambos ahora disponibles en Novita AI, una plataforma de nube de IA que ofrece a los desarrolladores un despliegue sencillo de modelos de IA a través de nuestra API directa. Estos modelos ofrecen capacidades de razonamiento excepcionales a precios competitivos, con un rendimiento significativamente mejor que sus predecesores.
Novita AI ofrece ambos modelos DeepSeek-R1-0528 a tarifas competitivas con precios transparentes de pago por uso:
DeepSeek-R1-0528 (Modelo completo):
- Tokens de entrada: $0.7 por millón de tokens
- Tokens de salida: $2.5 por millón de tokens
DeepSeek-R1-0528-Qwen3-8B (Modelo eficiente de 8B):
- Tokens de entrada: $0.06 por millón de tokens
- Tokens de salida: $0.09 por millón de tokens
Prueba la demo de DeepSeek-R1-0528
¿Qué es DeepSeek-R1-0528?
El modelo DeepSeek R1 ha recibido una actualización de versión menor, siendo la versión actual DeepSeek-R1-0528. En esta última actualización, DeepSeek R1 ha mejorado significativamente su profundidad de razonamiento y capacidades de inferencia al aprovechar mayores recursos computacionales e introducir mecanismos de optimización algorítmica durante el post-entrenamiento.
El modelo demuestra un rendimiento sobresaliente en diversas evaluaciones de referencia, incluyendo matemáticas, programación y lógica general. Su rendimiento general ahora se acerca al de modelos líderes como O3 y Gemini 2.5 Pro.
Principales mejoras de DeepSeek-R1-0528
🔹 Rendimiento mejorado en benchmarks en tareas de matemáticas, codificación y razonamiento
🔹 Capacidades front-end mejoradas para una mejor experiencia de usuario
🔹 Alucinaciones reducidas para salidas más fiables
🔹 Soporte para salida JSON y llamada a funciones para una integración perfecta
Mayor profundidad de razonamiento
En comparación con la versión anterior, el modelo mejorado muestra avances significativos en el manejo de tareas complejas de razonamiento. Por ejemplo, en la prueba AIME 2025, la precisión del modelo aumentó del 70% en la versión anterior al 87.5% en la versión actual.
Este avance proviene de una mayor profundidad de pensamiento durante el proceso de razonamiento: en el conjunto de prueba AIME, el modelo anterior usaba un promedio de 12K tokens por pregunta, mientras que la nueva versión promedia 23K tokens por pregunta.
Rendimiento competitivo frente a líderes de la industria
DeepSeek-R1-0528 demuestra un rendimiento notable en comparación con modelos líderes de la industria en múltiples benchmarks desafiantes:

DeepSeek-R1 vs DeepSeek-R1-0528
Rendimiento en razonamiento matemático
| Benchmark | DeepSeek R1 | DeepSeek R1-0528 | Mejora |
|---|---|---|---|
| AIME 2024 (Pass@1) | 79.8 | 91.4 | +11.6 |
| AIME 2025 (Pass@1) | 70.0 | 87.5 | +17.5 |
| HMMT 2025 (Pass@1) | 41.7 | 79.4 | +37.7 |
| CNMO 2024 (Pass@1) | 78.8 | 86.9 | +8.1 |
Mejora en rendimiento de codificación
| Benchmark | DeepSeek R1 | DeepSeek R1-0528 | Mejora |
|---|---|---|---|
| LiveCodeBench (Pass@1) | 63.5 | 73.3 | +9.8 |
| Codeforces-Div1 (Rating) | 1530 | 1930 | +400 |
| SWE Verified (Resuelto) | 49.2 | 57.6 | +8.4 |
| Aider-Polyglot (Precisión) | 53.3 | 71.6 | +18.3 |
Tareas de razonamiento general
| Benchmark | DeepSeek R1 | DeepSeek R1-0528 | Mejora |
|---|---|---|---|
| MMLU-Redux (EM) | 92.9 | 93.4 | +0.5 |
| MMLU-Pro (EM) | 84.0 | 85.0 | +1.0 |
| GPQA-Diamond (Pass@1) | 71.5 | 81.0 | +9.5 |
| SimpleQA (Correcto) | 30.1 | 27.8 | -2.3 |
| FRAMES (Precisión) | 82.5 | 83.0 | +0.5 |
| Humanity’s Last Exam (Pass@1) | 8.5 | 17.7 | +9.2 |
Nuevas capacidades de integración de herramientas
DeepSeek-R1-0528 introduce capacidades mejoradas en llamada a funciones e integración de herramientas:
- BFCL_v3_MultiTurn (Precisión): 37.0%
- Tau-Bench (Pass@1): 53.5% (Aerolínea) / 63.9% (Venta minorista)
DeepSeek-R1-0528-Qwen3-8B: Excelencia compacta
DeepSeek destiló el razonamiento de cadena de pensamiento de DeepSeek-R1-0528 para crear DeepSeek-R1-0528-Qwen3-8B a partir de Qwen3 8B Base. Este modelo logra el rendimiento de última generación (SOTA) entre los modelos de código abierto en AIME 2024, superando a Qwen3-8B en +10.0% e igualando el rendimiento de Qwen3-235B-thinking.
Esto demuestra que la cadena de pensamiento de DeepSeek-R1-0528 tiene una importancia significativa tanto para la investigación académica sobre modelos de razonamiento como para el desarrollo industrial centrado en modelos a pequeña escala.
Análisis comparativo con modelos líderes
| Modelo | AIME 24 | AIME 25 | HMMT Feb 25 | GPQA Diamond | LiveCodeBench |
|---|---|---|---|---|---|
| Qwen3-235B-A22B | 85.7 | 81.5 | 62.5 | 71.1 | 66.5 |
| Qwen3-32B | 81.4 | 72.9 | - | 68.4 | - |
| Qwen3-8B | 76.0 | 67.3 | - | 62.0 | - |
| Phi-4-Reasoning-Plus-14B | 81.3 | 78.0 | 53.6 | 69.3 | - |
| Gemini-2.5-Flash-Thinking-0520 | 82.3 | 72.0 | 64.2 | 82.8 | 62.3 |
| o3-mini (medio) | 79.6 | 76.7 | 53.3 | 76.8 | 65.9 |
| DeepSeek-R1-0528-Qwen3-8B | 86.0 | 76.3 | 61.5 | 61.1 | 60.5 |
Mejoras de uso y detalles técnicos
Funcionalidades de usabilidad mejoradas
En comparación con versiones anteriores de DeepSeek-R1, las recomendaciones de uso para DeepSeek-R1-0528 incluyen las siguientes mejoras:
- Soporte de prompt del sistema: a diferencia de versiones anteriores, ahora puedes usar prompts del sistema para proporcionar contexto e instrucciones coherentes
- Patrón de pensamiento automático: no se requiere activación manual: el modelo activa automáticamente sus capacidades de razonamiento sin necesidad de " pensando\ " al inicio de las salidas
Arquitectura de DeepSeek-R1-0528-Qwen3-8B
La arquitectura del modelo DeepSeek-R1-0528-Qwen3-8B es idéntica a la de Qwen3-8B, pero comparte la misma configuración de tokenizador que DeepSeek-R1-0528. Este modelo se puede ejecutar de la misma manera que Qwen3-8B, pero asegúrate de que todos los archivos de configuración provengan del repositorio de DeepSeek, no del proyecto original de Qwen3.
Por qué los desarrolladores eligen Novita AI
Despliegue simplificado de modelos de IA
- Sin problemas de infraestructura: concéntrate en crear aplicaciones, no en gestionar servidores
- Acceso instantáneo a modelos: despliega modelos de última generación con una sola llamada API
- Rendimiento fiable: infraestructura de nivel empresarial con un 99.9% de tiempo de actividad
- Disponibilidad global: acceso de baja latencia desde cualquier parte del mundo
Perfecto para cualquier escala
- Prototipado rápido: prueba ideas rápidamente con acceso inmediato a modelos
- Listo para producción: escala sin problemas desde prototipo hasta producción
- Rentable: paga solo por lo que usas con precios transparentes
- Soporte empresarial: asistencia dedicada para aplicaciones de alto volumen
Casos de uso ideales
- Aplicaciones matemáticas de IA: crea plataformas de tutoría que logran un 87.5% de precisión en AIME 2025
- Herramientas de generación de código: crea asistentes de desarrollo con un 73.3% de éxito en LiveCodeBench
- Plataformas de investigación: despliega modelos de razonamiento que compiten con líderes de la industria
- Software educativo: desarrolla aplicaciones de resolución de problemas paso a paso
Cómo empezar en Novita AI
- Regístrate en segundos en Novita AI y reclama $10 de créditos gratis
- Explora DeepSeek-R1-0528 (capacidad completa) o DeepSeek-R1-0528-Qwen3-8B (eficiente)
- Obtén tu clave API desde el panel de control
- Realiza tu primera llamada API usando nuestros endpoints compatibles con OpenAI
- Empieza a construir con capacidades de razonamiento líderes en la industria
Para usuarios de Python:
from openai import OpenAI
base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"
client = OpenAI(
base_url=base_url,
api_key=api_key,
)
stream = True # or False
max_tokens = 1000
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
extra_body={
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Conclusión
Los modelos de la serie DeepSeek-R1-0528 ofrecen un rendimiento líder en la industria a precios competitivos — logrando un 91.4% en AIME 2024 y un 73.3% en LiveCodeBench, rivalizando con las capacidades de OpenAI-o3 y Gemini-2.5-Pro.
A través de la plataforma amigable para desarrolladores de Novita AI, obtienes acceso instantáneo a estos modelos de vanguardia sin la complejidad de la infraestructura. Con precios transparentes, $10 de créditos gratis y nuestra API intuitiva, integrar razonamiento de clase mundial en tus aplicaciones nunca ha sido tan fácil.
Novita AI es una plataforma de nube de IA que ofrece a los desarrolladores una forma sencilla de desplegar modelos de IA usando nuestra API simple, al mismo tiempo que proporciona una nube GPU asequible y fiable para construir y escalar.
