DeepSeek-R1-0528 y DeepSeek-R1-0528-Qwen3-8B ya disponibles en Novita AI

DeepSeek-R1-0528 y DeepSeek-R1-0528-Qwen3-8B ya disponibles en Novita AI

DeepSeek ha lanzado dos modelos innovadores — DeepSeek-R1-0528 y DeepSeek-R1-0528-Qwen3-8B — ambos ahora disponibles en Novita AI, una plataforma de nube de IA que ofrece a los desarrolladores un despliegue sencillo de modelos de IA a través de nuestra API directa. Estos modelos ofrecen capacidades de razonamiento excepcionales a precios competitivos, con un rendimiento significativamente mejor que sus predecesores.

Novita AI ofrece ambos modelos DeepSeek-R1-0528 a tarifas competitivas con precios transparentes de pago por uso:

DeepSeek-R1-0528 (Modelo completo):

  • Tokens de entrada: $0.7 por millón de tokens
  • Tokens de salida: $2.5 por millón de tokens

DeepSeek-R1-0528-Qwen3-8B (Modelo eficiente de 8B):

  • Tokens de entrada: $0.06 por millón de tokens
  • Tokens de salida: $0.09 por millón de tokens

Prueba la demo de DeepSeek-R1-0528

¿Qué es DeepSeek-R1-0528?

El modelo DeepSeek R1 ha recibido una actualización de versión menor, siendo la versión actual DeepSeek-R1-0528. En esta última actualización, DeepSeek R1 ha mejorado significativamente su profundidad de razonamiento y capacidades de inferencia al aprovechar mayores recursos computacionales e introducir mecanismos de optimización algorítmica durante el post-entrenamiento.

El modelo demuestra un rendimiento sobresaliente en diversas evaluaciones de referencia, incluyendo matemáticas, programación y lógica general. Su rendimiento general ahora se acerca al de modelos líderes como O3 y Gemini 2.5 Pro.

Principales mejoras de DeepSeek-R1-0528

🔹 Rendimiento mejorado en benchmarks en tareas de matemáticas, codificación y razonamiento
🔹 Capacidades front-end mejoradas para una mejor experiencia de usuario
🔹 Alucinaciones reducidas para salidas más fiables
🔹 Soporte para salida JSON y llamada a funciones para una integración perfecta

Mayor profundidad de razonamiento

En comparación con la versión anterior, el modelo mejorado muestra avances significativos en el manejo de tareas complejas de razonamiento. Por ejemplo, en la prueba AIME 2025, la precisión del modelo aumentó del 70% en la versión anterior al 87.5% en la versión actual.

Este avance proviene de una mayor profundidad de pensamiento durante el proceso de razonamiento: en el conjunto de prueba AIME, el modelo anterior usaba un promedio de 12K tokens por pregunta, mientras que la nueva versión promedia 23K tokens por pregunta.

Rendimiento competitivo frente a líderes de la industria

DeepSeek-R1-0528 demuestra un rendimiento notable en comparación con modelos líderes de la industria en múltiples benchmarks desafiantes:

deepseek r1 0528 benchmark

DeepSeek-R1 vs DeepSeek-R1-0528

Rendimiento en razonamiento matemático

Benchmark DeepSeek R1 DeepSeek R1-0528 Mejora
AIME 2024 (Pass@1) 79.8 91.4 +11.6
AIME 2025 (Pass@1) 70.0 87.5 +17.5
HMMT 2025 (Pass@1) 41.7 79.4 +37.7
CNMO 2024 (Pass@1) 78.8 86.9 +8.1

Mejora en rendimiento de codificación

Benchmark DeepSeek R1 DeepSeek R1-0528 Mejora
LiveCodeBench (Pass@1) 63.5 73.3 +9.8
Codeforces-Div1 (Rating) 1530 1930 +400
SWE Verified (Resuelto) 49.2 57.6 +8.4
Aider-Polyglot (Precisión) 53.3 71.6 +18.3

Tareas de razonamiento general

Benchmark DeepSeek R1 DeepSeek R1-0528 Mejora
MMLU-Redux (EM) 92.9 93.4 +0.5
MMLU-Pro (EM) 84.0 85.0 +1.0
GPQA-Diamond (Pass@1) 71.5 81.0 +9.5
SimpleQA (Correcto) 30.1 27.8 -2.3
FRAMES (Precisión) 82.5 83.0 +0.5
Humanity’s Last Exam (Pass@1) 8.5 17.7 +9.2

Nuevas capacidades de integración de herramientas

DeepSeek-R1-0528 introduce capacidades mejoradas en llamada a funciones e integración de herramientas:

  • BFCL_v3_MultiTurn (Precisión): 37.0%
  • Tau-Bench (Pass@1): 53.5% (Aerolínea) / 63.9% (Venta minorista)

DeepSeek-R1-0528-Qwen3-8B: Excelencia compacta

DeepSeek destiló el razonamiento de cadena de pensamiento de DeepSeek-R1-0528 para crear DeepSeek-R1-0528-Qwen3-8B a partir de Qwen3 8B Base. Este modelo logra el rendimiento de última generación (SOTA) entre los modelos de código abierto en AIME 2024, superando a Qwen3-8B en +10.0% e igualando el rendimiento de Qwen3-235B-thinking.

Esto demuestra que la cadena de pensamiento de DeepSeek-R1-0528 tiene una importancia significativa tanto para la investigación académica sobre modelos de razonamiento como para el desarrollo industrial centrado en modelos a pequeña escala.

Análisis comparativo con modelos líderes

Modelo AIME 24 AIME 25 HMMT Feb 25 GPQA Diamond LiveCodeBench
Qwen3-235B-A22B 85.7 81.5 62.5 71.1 66.5
Qwen3-32B 81.4 72.9 - 68.4 -
Qwen3-8B 76.0 67.3 - 62.0 -
Phi-4-Reasoning-Plus-14B 81.3 78.0 53.6 69.3 -
Gemini-2.5-Flash-Thinking-0520 82.3 72.0 64.2 82.8 62.3
o3-mini (medio) 79.6 76.7 53.3 76.8 65.9
DeepSeek-R1-0528-Qwen3-8B 86.0 76.3 61.5 61.1 60.5

Mejoras de uso y detalles técnicos

Funcionalidades de usabilidad mejoradas

En comparación con versiones anteriores de DeepSeek-R1, las recomendaciones de uso para DeepSeek-R1-0528 incluyen las siguientes mejoras:

  • Soporte de prompt del sistema: a diferencia de versiones anteriores, ahora puedes usar prompts del sistema para proporcionar contexto e instrucciones coherentes
  • Patrón de pensamiento automático: no se requiere activación manual: el modelo activa automáticamente sus capacidades de razonamiento sin necesidad de " pensando\ " al inicio de las salidas

Arquitectura de DeepSeek-R1-0528-Qwen3-8B

La arquitectura del modelo DeepSeek-R1-0528-Qwen3-8B es idéntica a la de Qwen3-8B, pero comparte la misma configuración de tokenizador que DeepSeek-R1-0528. Este modelo se puede ejecutar de la misma manera que Qwen3-8B, pero asegúrate de que todos los archivos de configuración provengan del repositorio de DeepSeek, no del proyecto original de Qwen3.

Por qué los desarrolladores eligen Novita AI

Despliegue simplificado de modelos de IA

  • Sin problemas de infraestructura: concéntrate en crear aplicaciones, no en gestionar servidores
  • Acceso instantáneo a modelos: despliega modelos de última generación con una sola llamada API
  • Rendimiento fiable: infraestructura de nivel empresarial con un 99.9% de tiempo de actividad
  • Disponibilidad global: acceso de baja latencia desde cualquier parte del mundo

Perfecto para cualquier escala

  • Prototipado rápido: prueba ideas rápidamente con acceso inmediato a modelos
  • Listo para producción: escala sin problemas desde prototipo hasta producción
  • Rentable: paga solo por lo que usas con precios transparentes
  • Soporte empresarial: asistencia dedicada para aplicaciones de alto volumen

Casos de uso ideales

  • Aplicaciones matemáticas de IA: crea plataformas de tutoría que logran un 87.5% de precisión en AIME 2025
  • Herramientas de generación de código: crea asistentes de desarrollo con un 73.3% de éxito en LiveCodeBench
  • Plataformas de investigación: despliega modelos de razonamiento que compiten con líderes de la industria
  • Software educativo: desarrolla aplicaciones de resolución de problemas paso a paso

Cómo empezar en Novita AI

  1. Regístrate en segundos en Novita AI y reclama $10 de créditos gratis
  2. Explora DeepSeek-R1-0528 (capacidad completa) o DeepSeek-R1-0528-Qwen3-8B (eficiente)
  3. Obtén tu clave API desde el panel de control
  4. Realiza tu primera llamada API usando nuestros endpoints compatibles con OpenAI
  5. Empieza a construir con capacidades de razonamiento líderes en la industria

Para usuarios de Python:

from openai import OpenAI

base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "deepseek/deepseek-r1-0528"

client = OpenAI(
    base_url=base_url,
    api_key=api_key,
)

stream = True # or False
max_tokens = 1000

response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    extra_body={
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Conclusión

Los modelos de la serie DeepSeek-R1-0528 ofrecen un rendimiento líder en la industria a precios competitivos — logrando un 91.4% en AIME 2024 y un 73.3% en LiveCodeBench, rivalizando con las capacidades de OpenAI-o3 y Gemini-2.5-Pro.

A través de la plataforma amigable para desarrolladores de Novita AI, obtienes acceso instantáneo a estos modelos de vanguardia sin la complejidad de la infraestructura. Con precios transparentes, $10 de créditos gratis y nuestra API intuitiva, integrar razonamiento de clase mundial en tus aplicaciones nunca ha sido tan fácil.

Novita AI es una plataforma de nube de IA que ofrece a los desarrolladores una forma sencilla de desplegar modelos de IA usando nuestra API simple, al mismo tiempo que proporciona una nube GPU asequible y fiable para construir y escalar.