4 formas de usar DeepSeek R1 gratis

4 formas de usar DeepSeek R1 gratis

Puntos clave

Rendimiento avanzado: Destaca en evaluaciones de matemáticas y codificación.

Código abierto: Accesible para investigación, modificación e implementación.

Eficiencia de costos: Ofrece un rendimiento comparable al de OpenAI o1 a una fracción del costo.

4 formas gratuitas: Plataformas en línea, Localmente, API, AI Playgrounds

DeepSeek R1 es un modelo de razonamiento de vanguardia diseñado para competir con OpenAI o1, destacándose en tareas complejas como inferencia lógica, matemáticas y programación. Su naturaleza de código abierto y su enfoque en capacidades avanzadas de razonamiento lo convierten en una herramienta muy valiosa para desarrolladores y empresas. Sin embargo, R1 tiene un precio más alto en comparación con DeepSeek V3. Para ayudarte a comenzar, aquí te presentamos cuatro formas gratuitas de explorar y utilizar DeepSeek R1.

Resumen de DeepSeek R1

DeepSeek-R1 está diseñado para abordar tareas que requieren razonamiento lógico, matemáticas avanzadas y programación. Se basa en DeepSeek-R1-Zero combinando aprendizaje por refuerzo con ajuste fino supervisado para mejorar la claridad y coherencia de las salidas. DeepSeek-R1 alcanza un rendimiento comparable al de OpenAI-o1 en tareas de matemáticas, código y razonamiento.

¡Obtén $20 en créditos y comienza una prueba gratuita de DeepSeek R1 ahora!

Características principales

  • Tamaño del modelo: 671B parámetros (37B activos/token)
  • Tokenizador: Tokenizador mejorado con etiquetas de autorreflexión
  • Idiomas compatibles: Multilingüe con adaptación cultural
  • Modalidad: Solo texto
  • Ventana de contexto: 128K tokens
  • Formatos de almacenamiento: Soporte de cuantización Q8/Q5
  • Arquitectura: Mezcla de Expertos (MoE) + pipeline de entrenamiento mejorado con RL
  • Método de entrenamiento: Construido sobre la base de V3 con pipeline RL (SFT → RL → SFT → RL)
  • Datos de entrenamiento: Base V3 + datos de optimización RL

Evaluaciones comparativas de rendimiento

DeepSeek-R1 sobresale en matemáticas, logrando puntuaciones máximas del 97.3% en MATH-500 y 79.8% en AIME 2024, superando a la competencia. En codificación, destaca con un 49.2% en SWE-bench Verified y un 65.9% en Live Code Bench, demostrando su experiencia completa en ambos dominios.

Evaluación comparativa de DeepSeek R1

Todos los modelos se evalúan con una longitud máxima de generación de 32,768 tokens, utilizando parámetros de muestreo específicos (temperatura 0.6, top-p 0.95 y 64 respuestas por consulta) para calcular pass@1 en las evaluaciones comparativas.

Modelos DeepSeek-R1-Distill

La destilación, o transferencia de conocimiento, es un método de aprendizaje automático que transfiere conocimiento de un modelo grande a uno más pequeño. El objetivo es desarrollar un modelo más eficiente que pueda lograr un rendimiento similar al del modelo grande.

DeepSeek también ha lanzado versiones destiladas de R1, que ofrecen modelos más pequeños que retienen gran parte de las capacidades del modelo original y son más eficientes computacionalmente. Estos modelos se ajustan finamente utilizando datos generados por DeepSeek-R1 y están disponibles en tamaños desde 1.5 mil millones hasta 70 mil millones de parámetros.

Evaluación comparativa de los modelos DeepSeek-R1-Distill

Fuente: Documento de publicación de DeepSeek

1. Usa plataformas en línea para acceder a DeepSeek R1 (ej. Novita AI)

Puedes acceder a DeepSeek-R1 a través de la plataforma Novita AI, que ofrece una forma sencilla de interactuar con el modelo. Para comenzar, simplemente ve a la página de chat y regístrate. Sin embargo, ten en cuenta que la plataforma en línea no admite guardar el historial de chat de sesiones anteriores.

Además, Novita AI ofrece un panel de ajuste de parámetros que te permite personalizar configuraciones como max tokens, temperatura y más para adaptarse a tu caso de uso específico.

¡Obtén $20 en créditos en Novita AI ahora!

2. Ejecuta DeepSeek R1 localmente

1. Instala Ollama

2. Descarga el modelo DeepSeek-R1

  • Abre tu terminal y ejecuta (usando la versión de 7B parámetros como ejemplo): bashCopyollama run deepseek-r1:7b (Espera a que se complete la descarga; el tiempo depende de la velocidad de la red.)
ollama run deepseek-r1:7b

3. Verifica y ejecuta

  • Verifica la instalación:
ollama list  # Check if "deepseek-r1" appears in the list
  • Inicia el modelo:
ollama run deepseek-r1:7b

4. Ejemplos de uso

  • Haz una consulta: bashCopy>>> "Explica la computación cuántica en términos simples."
  • Genera código: bashCopy>>> "Escribe una función en Python para calcular la secuencia de Fibonacci."

3. Accede a APIs gratuitas de DeepSeek R1 (ej. Novita AI)

Novita AI es una plataforma en la nube de IA que ofrece a los desarrolladores una forma sencilla de implementar modelos de IA mediante nuestra API simple, al mismo tiempo que proporciona la nube GPU asequible y confiable para construir y escalar.

Paso 1: Inicia sesión y accede a la biblioteca de modelos

Inicia sesión en tu cuenta y haz clic en el botón Model Library (Biblioteca de modelos).

Inicia sesión y accede a la biblioteca de modelos

Paso 2: Elige tu modelo

Navega por las opciones disponibles y selecciona el modelo que se adapte a tus necesidades.

elige modelos

Paso 3: Comienza tu prueba gratuita

Inicia tu prueba gratuita para explorar las capacidades del modelo seleccionado.

inicia prueba gratuita en r1

Paso 4: Obtén tu clave API

Para autenticarte con la API, te proporcionaremos una nueva clave API. Entra en la página de “Settings” (Configuración), puedes copiar la clave API como se indica en la imagen.

obtén clave api

Paso 5: Instala la API

Instala la API usando el gestor de paquetes específico de tu lenguaje de programación.

instala api

Después de la instalación, importa las bibliotecas necesarias en tu entorno de desarrollo. Inicializa la API con tu clave API para empezar a interactuar con Novita AI LLM. Este es un ejemplo de uso de la API de completaciones de chat para usuarios de Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=&#91;
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices&#91;0].delta.content or "", end="")
else:
    print(chat_completion_res.choices&#91;0].message.content)
  
  

4. Experimenta con DeepSeek R1 en Hugging Face

Paso 1: Configura las claves API

  • Navega a la configuración de tu cuenta de usuario para gestionar tus claves API.
  • Agrega tus claves API personalizadas de Novita AI a Hugging Face.

Configura las claves API en Hugging Face

Paso 2: Elige los modos de API de inferencia

  • Modo de clave personalizada: Las llamadas se envían directamente al proveedor de inferencia, utilizando tu propia clave API.
  • Modo enrutado por HF: En este modo, no se requiere token del proveedor. Los cargos se aplican a tu cuenta de Hugging Face en lugar de la cuenta del proveedor.

Elige los modos de API de inferencia

Paso 3: Explora proveedores compatibles en las páginas de modelos

  • Las páginas de modelos muestran proveedores de inferencia de terceros compatibles con el modelo seleccionado (los que son compatibles con el modelo actual, ordenados por preferencia del usuario).

Explora proveedores compatibles en las páginas de modelos en Hugging Face

Experimentar en AI Playgrounds es una excelente manera de explorar las capacidades de los modelos Llama 3 sin necesidad de habilidades técnicas avanzadas ni configuración. Ya sea que uses HuggingChat para proyectos creativos, Meta AI Web para una integración perfecta en aplicaciones diarias, o Perplexity Labs para experimentos extendidos, estas plataformas hacen que la IA de vanguardia sea accesible y práctica para usuarios de todos los niveles.

Preguntas frecuentes

¿Es DeepSeek R1 mejor que OpenAI o1?

DeepSeek R1 ofrece un rendimiento comparable, especialmente en tareas de razonamiento, y es de código abierto y más rentable.

¿Qué tareas son más adecuadas para DeepSeek R1?

Tareas que requieren mucho razonamiento, como resolución de problemas matemáticos, codificación y aplicaciones específicas de la industria.

¿Se puede ajustar DeepSeek-R1 para tareas o industrias específicas?

Sí, DeepSeek-R1 se puede ajustar para tareas específicas, siempre que dispongas de los recursos computacionales y los datos necesarios.

Novita AI es la plataforma en la nube integral que impulsa tus ambiciones de IA. APIs integradas, sin servidor, instancias GPU (GPU Instance): las herramientas rentables que necesitas. Elimina la infraestructura, comienza gratis y haz realidad tu visión de IA.

Lecturas recomendadas