4 formas de usar DeepSeek R1 gratis

Tabla de contenido

Resumen de DeepSeek R1
1. Usa plataformas en línea para acceder a DeepSeek R1 (ej. Novita AI)
2. Ejecuta DeepSeek R1 localmente
3. Accede a APIs gratuitas de DeepSeek R1 (ej. Novita AI)
4. Experimenta con DeepSeek R1 en Hugging Face

Puntos clave

Rendimiento avanzado: Destaca en evaluaciones de matemáticas y codificación.

Código abierto: Accesible para investigación, modificación e implementación.

Eficiencia de costos: Ofrece un rendimiento comparable al de OpenAI o1 a una fracción del costo.

4 formas gratuitas: Plataformas en línea, Localmente, API, AI Playgrounds

DeepSeek R1 es un modelo de razonamiento de vanguardia diseñado para competir con OpenAI o1, destacándose en tareas complejas como inferencia lógica, matemáticas y programación. Su naturaleza de código abierto y su enfoque en capacidades avanzadas de razonamiento lo convierten en una herramienta muy valiosa para desarrolladores y empresas. Sin embargo, R1 tiene un precio más alto en comparación con DeepSeek V3. Para ayudarte a comenzar, aquí te presentamos cuatro formas gratuitas de explorar y utilizar DeepSeek R1.

Resumen de DeepSeek R1

DeepSeek-R1 está diseñado para abordar tareas que requieren razonamiento lógico, matemáticas avanzadas y programación. Se basa en DeepSeek-R1-Zero combinando aprendizaje por refuerzo con ajuste fino supervisado para mejorar la claridad y coherencia de las salidas. DeepSeek-R1 alcanza un rendimiento comparable al de OpenAI-o1 en tareas de matemáticas, código y razonamiento.

¡Obtén $20 en créditos y comienza una prueba gratuita de DeepSeek R1 ahora!

Características principales

Tamaño del modelo: 671B parámetros (37B activos/token)
Tokenizador: Tokenizador mejorado con etiquetas de autorreflexión
Idiomas compatibles: Multilingüe con adaptación cultural
Modalidad: Solo texto
Ventana de contexto: 128K tokens
Formatos de almacenamiento: Soporte de cuantización Q8/Q5
Arquitectura: Mezcla de Expertos (MoE) + pipeline de entrenamiento mejorado con RL
Método de entrenamiento: Construido sobre la base de V3 con pipeline RL (SFT → RL → SFT → RL)
Datos de entrenamiento: Base V3 + datos de optimización RL

Evaluaciones comparativas de rendimiento

DeepSeek-R1 sobresale en matemáticas, logrando puntuaciones máximas del 97.3% en MATH-500 y 79.8% en AIME 2024, superando a la competencia. En codificación, destaca con un 49.2% en SWE-bench Verified y un 65.9% en Live Code Bench, demostrando su experiencia completa en ambos dominios.

Todos los modelos se evalúan con una longitud máxima de generación de 32,768 tokens, utilizando parámetros de muestreo específicos (temperatura 0.6, top-p 0.95 y 64 respuestas por consulta) para calcular pass@1 en las evaluaciones comparativas.

Modelos DeepSeek-R1-Distill

La destilación, o transferencia de conocimiento, es un método de aprendizaje automático que transfiere conocimiento de un modelo grande a uno más pequeño. El objetivo es desarrollar un modelo más eficiente que pueda lograr un rendimiento similar al del modelo grande.

DeepSeek también ha lanzado versiones destiladas de R1, que ofrecen modelos más pequeños que retienen gran parte de las capacidades del modelo original y son más eficientes computacionalmente. Estos modelos se ajustan finamente utilizando datos generados por DeepSeek-R1 y están disponibles en tamaños desde 1.5 mil millones hasta 70 mil millones de parámetros.

Fuente: Documento de publicación de DeepSeek

1. Usa plataformas en línea para acceder a DeepSeek R1 (ej. Novita AI)

Puedes acceder a DeepSeek-R1 a través de la plataforma Novita AI, que ofrece una forma sencilla de interactuar con el modelo. Para comenzar, simplemente ve a la página de chat y regístrate. Sin embargo, ten en cuenta que la plataforma en línea no admite guardar el historial de chat de sesiones anteriores.

Además, Novita AI ofrece un panel de ajuste de parámetros que te permite personalizar configuraciones como max tokens, temperatura y más para adaptarse a tu caso de uso específico.

¡Obtén $20 en créditos en Novita AI ahora!

2. Ejecuta DeepSeek R1 localmente

1. Instala Ollama

Visita el sitio web de Ollama, descarga e instala la versión para tu sistema operativo.

2. Descarga el modelo DeepSeek-R1

Abre tu terminal y ejecuta (usando la versión de 7B parámetros como ejemplo): bashCopyollama run deepseek-r1:7b (Espera a que se complete la descarga; el tiempo depende de la velocidad de la red.)

ollama run deepseek-r1:7b

3. Verifica y ejecuta

Verifica la instalación:

ollama list  # Check if "deepseek-r1" appears in the list

Inicia el modelo:

ollama run deepseek-r1:7b

4. Ejemplos de uso

Haz una consulta: bashCopy>>> "Explica la computación cuántica en términos simples."
Genera código: bashCopy>>> "Escribe una función en Python para calcular la secuencia de Fibonacci."

3. Accede a APIs gratuitas de DeepSeek R1 (ej. Novita AI)

Novita AI es una plataforma en la nube de IA que ofrece a los desarrolladores una forma sencilla de implementar modelos de IA mediante nuestra API simple, al mismo tiempo que proporciona la nube GPU asequible y confiable para construir y escalar.

Paso 1: Inicia sesión y accede a la biblioteca de modelos

Inicia sesión en tu cuenta y haz clic en el botón Model Library (Biblioteca de modelos).

Paso 2: Elige tu modelo

Navega por las opciones disponibles y selecciona el modelo que se adapte a tus necesidades.

Paso 3: Comienza tu prueba gratuita

Inicia tu prueba gratuita para explorar las capacidades del modelo seleccionado.

Paso 4: Obtén tu clave API

Para autenticarte con la API, te proporcionaremos una nueva clave API. Entra en la página de “Settings” (Configuración), puedes copiar la clave API como se indica en la imagen.

Paso 5: Instala la API

Instala la API usando el gestor de paquetes específico de tu lenguaje de programación.

Después de la instalación, importa las bibliotecas necesarias en tu entorno de desarrollo. Inicializa la API con tu clave API para empezar a interactuar con Novita AI LLM. Este es un ejemplo de uso de la API de completaciones de chat para usuarios de Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=&#91;
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices&#91;0].delta.content or "", end="")
else:
    print(chat_completion_res.choices&#91;0].message.content)

4. Experimenta con DeepSeek R1 en Hugging Face

Paso 1: Configura las claves API

Navega a la configuración de tu cuenta de usuario para gestionar tus claves API.
Agrega tus claves API personalizadas de Novita AI a Hugging Face.

Paso 2: Elige los modos de API de inferencia

Modo de clave personalizada: Las llamadas se envían directamente al proveedor de inferencia, utilizando tu propia clave API.
Modo enrutado por HF: En este modo, no se requiere token del proveedor. Los cargos se aplican a tu cuenta de Hugging Face en lugar de la cuenta del proveedor.

Paso 3: Explora proveedores compatibles en las páginas de modelos

Las páginas de modelos muestran proveedores de inferencia de terceros compatibles con el modelo seleccionado (los que son compatibles con el modelo actual, ordenados por preferencia del usuario).

Experimentar en AI Playgrounds es una excelente manera de explorar las capacidades de los modelos Llama 3 sin necesidad de habilidades técnicas avanzadas ni configuración. Ya sea que uses HuggingChat para proyectos creativos, Meta AI Web para una integración perfecta en aplicaciones diarias, o Perplexity Labs para experimentos extendidos, estas plataformas hacen que la IA de vanguardia sea accesible y práctica para usuarios de todos los niveles.

Preguntas frecuentes

¿Es DeepSeek R1 mejor que OpenAI o1?

DeepSeek R1 ofrece un rendimiento comparable, especialmente en tareas de razonamiento, y es de código abierto y más rentable.

¿Qué tareas son más adecuadas para DeepSeek R1?

Tareas que requieren mucho razonamiento, como resolución de problemas matemáticos, codificación y aplicaciones específicas de la industria.

¿Se puede ajustar DeepSeek-R1 para tareas o industrias específicas?

Sí, DeepSeek-R1 se puede ajustar para tareas específicas, siempre que dispongas de los recursos computacionales y los datos necesarios.

Novita AI es la plataforma en la nube integral que impulsa tus ambiciones de IA. APIs integradas, sin servidor, instancias GPU (GPU Instance): las herramientas rentables que necesitas. Elimina la infraestructura, comienza gratis y haz realidad tu visión de IA.

4 formas de usar DeepSeek R1 gratis

Puntos clave

Resumen de DeepSeek R1

Características principales

Evaluaciones comparativas de rendimiento

Modelos DeepSeek-R1-Distill

1. Usa plataformas en línea para acceder a DeepSeek R1 (ej. Novita AI)

2. Ejecuta DeepSeek R1 localmente

3. Accede a APIs gratuitas de DeepSeek R1 (ej. Novita AI)

4. Experimenta con DeepSeek R1 en Hugging Face

Preguntas frecuentes

Lecturas recomendadas

Product

RESOURCES

Partners

Company

Puntos clave

Resumen de DeepSeek R1

Características principales

Evaluaciones comparativas de rendimiento

Modelos DeepSeek-R1-Distill

1. Usa plataformas en línea para acceder a DeepSeek R1 (ej. Novita AI)

2. Ejecuta DeepSeek R1 localmente

3. Accede a APIs gratuitas de DeepSeek R1 (ej. Novita AI)

4. Experimenta con DeepSeek R1 en Hugging Face

Preguntas frecuentes

Lecturas recomendadas

Publicaciones relacionadas

Product

RESOURCES

Partners

Company