Cómo implementar DeepSeek-R1-0528-Qwen3-8B en instancias GPU de Novita AI

Cómo implementar DeepSeek-R1-0528-Qwen3-8B en instancias GPU de Novita AI

¿Qué pasaría si pudieras ejecutar un modelo de 8 mil millones de parámetros que supera a modelos 30 veces más grandes?

DeepSeek-R1-0528-Qwen3-8B ofrece un rendimiento de razonamiento revolucionario, equiparando a modelos de 235 mil millones de parámetros en tareas matemáticas complejas mientras funciona de manera eficiente en una sola RTX 4090.

Esta guía te muestra cómo implementar este modelo innovador en Novita AI en cuestión de minutos.

¿Qué es DeepSeek-R1-0528-Qwen3-8B?

DeepSeek-R1-0528-Qwen3-8B es un modelo de razonamiento sofisticado creado al destilar capacidades de razonamiento encadenado de DeepSeek-R1-0528 en el modelo base Qwen3 8B. Este enfoque innovador ha producido un modelo de código abierto de última generación que logra un rendimiento notable en evaluaciones de matemáticas y razonamiento, incluyendo AIME 2024, donde supera a Qwen3 8B en un +10.0% e iguala el rendimiento del modelo mucho más grande Qwen3-235B-thinking.

El modelo demuestra capacidades excepcionales en diversas métricas de evaluación, obteniendo 86.0 en AIME 24, 76.3 en AIME 25 y 61.5 en HMMT Feb 25. Lo que hace que este modelo sea particularmente valioso es su capacidad para ofrecer un rendimiento de razonamiento comparable al de modelos mucho más grandes, manteniendo al mismo tiempo la eficiencia y la facilidad de implementación de un modelo de 8 mil millones de parámetros.

Benchmark de DeepSeek-R1-0528-Qwen3-8B

¿Por qué ejecutar DeepSeek-R1-0528-Qwen3-8B en instancias GPU de Novita AI?

1. Importante ventaja de precio y modelos de precios flexibles

Novita AI ofrece precios competitivos en el mercado de computación GPU, haciendo que modelos avanzados de IA como DeepSeek-R1-0528-Qwen3-8B sean accesibles para investigadores, empresas y desarrolladores de cualquier escala.

Elige entre precios bajo demanda y por suscripción según tus patrones de uso. Para DeepSeek-R1-0528-Qwen3-8B ejecutándose en RTX 4090:

  • Bajo demanda: $0.35/hora - Adecuado para pruebas y cargas de trabajo variables
  • 1-5 meses: $226.80/mes (10% DE DESCUENTO) - Proyectos a mediano plazo
  • 6-11 meses: $206.64/mes (18% DE DESCUENTO) - Ciclos de desarrollo extendidos
  • 12 meses: $189.00/mes (25% DE DESCUENTO) - Mayores ahorros para compromisos a largo plazo

La suscripción anual puede ahorrarte cientos de dólares mientras garantiza la disponibilidad de recursos. Más información sobre modelos de precios.

2. Múltiples opciones de GPU para optimizar el rendimiento

Novita AI ofrece opciones completas de GPU para adaptarse a tus necesidades computacionales y presupuesto:

  • RTX 3090 24GB: Rentable para desarrollo y pruebas
  • RTX 4090 24GB: Recomendada para DeepSeek-R1-0528-Qwen3-8B - rendimiento y coste equilibrados
  • RTX 5090 32GB
  • RTX 6000 Ada 48GB: VRAM mejorada para contextos de mayor longitud
  • L40S 48GB: Rendimiento de nivel profesional con capacidad de memoria extendida
  • A100 SXM 80GB: Computación de alto rendimiento con amplio ancho de banda de memoria
  • H100 SXM 80GB: Rendimiento de nivel empresarial para implementaciones en producción

3. Plantillas listas para usar y flexibilidad personalizada

Las plantillas preconfiguradas para modelos populares como DeepSeek-R1-0528-Qwen3-8B eliminan la complejidad de la configuración manual, incluyendo configuraciones de contenedor optimizadas, variables de entorno y parámetros de implementación probados. Los usuarios avanzados pueden crear plantillas completamente personalizadas con configuraciones especializadas y scripts de implementación personalizados, garantizando tanto la facilidad de uso para principiantes como la personalización total para desarrolladores experimentados.

4. Red de implementación global

Implementa instancias GPU más cerca de tus usuarios a través de la red mundial de Novita AI con 15 regiones en América (EE. UU., Canadá, Brasil), Asia-Pacífico (Japón, Singapur, India, EAU, Hong Kong) y Europa (Alemania, Reino Unido). Esta infraestructura global garantiza una latencia reducida y un rendimiento fiable para tu implementación de DeepSeek-R1-0528-Qwen3-8B, proporcionando acceso confiable independientemente de la ubicación del usuario.

Cómo implementar DeepSeek-R1-0528-Qwen3-8B en Novita AI

Paso 1: Selección de plantilla

Selecciona la plantilla DeepSeek-R1-0528-Qwen3-8B de la biblioteca de modelos. Elige una RTX 4090 como tipo de GPU y haz clic en Implementar.

Elegir 4090

Paso 2: Confirmación de parámetros

Revisa los parámetros de implementación que se muestran en la pantalla de configuración. Verifica que todos los ajustes sean correctos y haz clic en Siguiente para continuar.

Usar la plantilla

Paso 3: Implementación de la instancia

Haz clic en Implementar para iniciar el proceso de creación de la instancia. El sistema comenzará a aprovisionar tu instancia GPU.

Implementar la plantilla

Paso 4: Supervisar el progreso de la implementación

Navega a Gestión de instancias para acceder a la consola de control. Este panel te permite seguir el estado de la implementación en tiempo real.

Paso 5: Ver el estado de descarga de la imagen

Haz clic en tu instancia específica para monitorear el progreso de la descarga de la imagen del contenedor. Este proceso puede tardar varios minutos dependiendo de las condiciones de la red.

Paso 6: Seguir la descarga del modelo

Después de que la instancia se inicie, comenzará a descargar el modelo. Haz clic en “Registros” → “Registros de instancia” para monitorear el progreso de la descarga del modelo.

Paso 7: Verificar la implementación exitosa

Busca el mensaje "Application startup complete." en los registros de la instancia. Esto indica que el proceso de implementación ha finalizado correctamente.

Paso 8: Obtener la URL de acceso

Haz clic en “Conectar” y luego en → “Conectar al servicio HTTP [Puerto 8000]”. Dado que es un servicio API, deberás copiar la dirección.

URL del sitio web

Paso 9: Acceder a tu modelo implementado

Para realizar solicitudes a tu modelo, reemplaza http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai con tu dirección expuesta real. ¡Copia el siguiente código para acceder a tu modelo privado!

# Llama al servidor usando curl:
curl -X POST "http://7a65a32b51e37482-8000.jp-tyo-1.gpu-instance.novita.ai/v1/chat/completions" \
        -H "Content-Type: application/json" \
        --data '{
                "model": "deepseek-ai/DeepSeek-R1-0528-Qwen3-8B",
                "messages": [
                        {
                                "role": "user",
                                "content": "What is the capital of France?"
                        }
                ]
        }'
{"id":"chatcmpl-56d12c91edbb46fcb93ccbbc0ecddd2c","object":"chat.completion","created":1748588145,"model":"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B","choices":[{"index":0,"message":{"role":"assistant","reasoning_content":null,"content":" thinking\
Okay, the user is asking for the capital of France. Let me start by recalling the basic answer. Paris is definitely the correct response, so I'll start with that.\
\
But why is the user asking this? They might be a student preparing for a test, or maybe someone traveling who needs to know the main city for planning. Alternatively, they could be testing my knowledge. But since it's a straightforward question, I'll focus on providing accurate information.\
\
Wait, maybe they need more context. Should I mention some points of interest to add value? Like Eiffel Tower or Louvre. That could help if they're interested in tourism or education. \
\
I should check if there's any recent political changes or administrative updates but nothing seems off with Paris' status as a capital. Alright, keep it simple but informative. Let me structure the answer first, then decide on the optional details. \
\
Also, considering the user might not want a long answer. But including key landmarks might make it more engaging. They didn't ask for historical info, so maybe just stick to the status and one or two unique facts. \
\
Yes, \"city of love\" is a common nickname, so that adds a nice touch. Alright, final answer will confirm Paris, mention the nicknames, and list two landmarks to cover possible interests without being overwhelming.\
 response\
The capital of France is **Paris**.","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":294,"completion_tokens":284,"prompt_tokens_details":null},"prompt_logprobs":null}

Configura la dirección API en tus aplicaciones como Chatbox, ¡y tendrás tu propio asistente personal!

Novita AI es una plataforma en la nube de IA que ofrece a los desarrolladores una forma sencilla de implementar modelos de IA usando nuestra API simple, al mismo tiempo que proporciona la nube GPU asequible y confiable para construir y escalar.