DeepSeek V3: Avanzando en Modelos de Código Abierto, Ahora Disponible en Novita AI

DeepSeek V3: Avanzando en Modelos de Código Abierto, Ahora Disponible en Novita AI

El mundo de la innovación de código abierto está dando un gran salto adelante con el lanzamiento de DeepSeek V3, un modelo avanzado de generación de código que promete redefinir cómo los desarrolladores abordan las tareas de programación. Ahora disponible en Novita AI, este modelo innovador está destinado a empoderar a desarrolladores, investigadores y entusiastas de la tecnología con capacidades sin precedentes.

¿Qué es DeepSeek V3?

DeepSeek V3 es un modelo de lenguaje grande de última generación basado en la arquitectura de Mezcla de Expertos (MoE), con 671 mil millones de parámetros, de los cuales 37 mil millones se activan por token durante la inferencia. Publicado como modelo de código abierto, permite a los desarrolladores abordar desafíos complejos en codificación, razonamiento, matemáticas y generación de texto.

DeepSeek V3 se destaca por su arquitectura eficiente y entrenamiento rentable. Su entrenamiento requirió solo 2.788 millones de horas de GPU H800, con un costo aproximado de $5.5 millones, mucho menos que los recursos necesarios para modelos cerrados comparables como GPT-4. Al incorporar técnicas innovadoras como la Atención Latente Multi-Cabeza (MLA) y la Predicción Multi-Token (MTP), DeepSeek V3 ofrece un rendimiento excepcional mientras sigue siendo escalable y accesible.

Características Clave de DeepSeek V3

1. Arquitectura de Mezcla de Expertos (MoE)

DeepSeek V3 emplea un marco MoE con técnicas de equilibrio de carga dinámico de grano fino. A diferencia de los modelos MoE tradicionales, elimina la necesidad de pérdida auxiliar, asegurando que los recursos computacionales se distribuyan de manera eficiente sin degradación del rendimiento.

2. Atención Latente Multi-Cabeza (MLA)

MLA mejora la eficiencia de inferencia al comprimir las claves y valores de atención, reduciendo la sobrecarga de memoria mientras mantiene una alta calidad de atención. Esto permite que DeepSeek V3 maneje ventanas de contexto largas de hasta 128K tokens, haciéndolo ideal para tareas que involucran entrada de texto extendida.

3. Predicción Multi-Token (MTP)

El objetivo MTP permite que DeepSeek V3 prediga múltiples tokens simultáneamente, mejorando tanto la eficiencia del entrenamiento como la velocidad de inferencia. Esta característica es particularmente útil para generar contenido de formato largo o resolver problemas complejos.

4. Entrenamiento de Precisión Mixta FP8

DeepSeek V3 utiliza precisión FP8 (punto flotante de 8 bits) para el entrenamiento, reduciendo los costos de memoria y computación mientras mantiene la estabilidad numérica. Esta innovación permite que el modelo escale eficientemente sin requerir una gran huella de hardware.

5. Soporte para Idiomas Inglés y Chino

DeepSeek V3 está optimizado para inglés y chino, lo que lo convierte en una excelente opción para desarrolladores que construyen aplicaciones multilingües para estos dos idiomas ampliamente utilizados. Aunque no admite una amplia gama de idiomas, sobresale en estos dominios específicos.

Rendimiento de DeepSeek V3 en Benchmarks

DeepSeek V3 supera consistentemente a muchos modelos de código abierto e incluso cerrados en una variedad de benchmarks. A continuación, se muestra una comparación de su rendimiento:

DeepSeek 3 benchmark

  1. Excelencia en Codificación:

    • DeepSeek V3 logra 82.6% en HumanEval-Mul (Pass@1) y 51.6% en Codeforces, lo que lo convierte en una solución robusta para tareas de generación y evaluación de código.
    • En LiveCodeBench (Pass@1-COT), supera significativamente a sus predecesores con 40.5%, y compite favorablemente contra otros modelos.
  2. Razonamiento Matemático:

    • DeepSeek V3 lidera en MATH-500 (90.2%) y muestra un rendimiento sólido en CNMO 2024 (Pass@1) y AIME 2024, demostrando su capacidad para manejar la resolución de problemas matemáticos avanzados.
  3. Capacidades Multilingües:

    • Con 90.9% en CLUEWSC y 86.5% en C-Eval, DeepSeek V3 se consolida como un excelente modelo para tareas específicas en chino, mientras mantiene un rendimiento robusto en benchmarks en inglés como MMLU (88.5%).
  4. Conocimiento General y Razonamiento:

    • Alcanza 91.6% en DROP (3-shot F1) y 89.1% en MMLU-Redux, lo que demuestra su utilidad en aplicaciones intensivas en conocimiento.

Prueba la Demo de DeepSeek V3 Ahora

Opciones de Despliegue para DeepSeek V3

DeepSeek V3 ofrece flexibilidad en el despliegue, permitiendo a los usuarios integrarlo sin problemas en sus flujos de trabajo. Ya sea que prefieras ejecutarlo localmente o en la nube, el modelo admite una variedad de hardware y herramientas de software comunitarias. Estas son las opciones recomendadas para el despliegue:

  1. DeepSeek-Infer Demo: Una demo simple y ligera para inferencia FP8 y BF16, que proporciona una manera fácil de probar el modelo.
  2. SGLang: Soporta completamente el modelo DeepSeek-V3 en modos de inferencia BF16 y FP8, con soporte para Predicción Multi-Token próximamente.
  3. LMDeploy: Permite una inferencia eficiente FP8 y BF16 tanto para despliegue local como en la nube.
  4. TensorRT-LLM: Actualmente soporta inferencia BF16 y cuantización INT4/INT8, con soporte FP8 planificado para futuras actualizaciones.
  5. vLLM: Soporta DeepSeek V3 en modos FP8 y BF16, habilitando paralelismo de tensor y paralelismo de pipeline para un escalado eficiente.

Accede a la API de DeepSeek V3 a través de Novita AI

La plataforma de Novita AI simplifica el despliegue de DeepSeek V3 al proporcionar APIs preconfiguradas e infraestructura de GPU en la nube asequible. Los desarrolladores pueden integrar el modelo sin problemas en sus aplicaciones sin preocuparse por la configuración del hardware o la escalabilidad.

Para comenzar con DeepSeek V3 en Novita AI, sigue estos pasos:

Paso 1: Ve a Novita AI e inicia sesión usando tu cuenta de Google, GitHub o correo electrónico.

Paso 2: Prueba la Demo de DeepSeek V3.

Deepseek v3

Paso 3: Monitorea la Consola de Métricas LLM del modelo en Novita AI.

Paso 4: Obtén tu Clave API:

  • Navega a “Key Management” en la configuración.
  • Se crea una clave predeterminada en tu primer inicio de sesión.
  • Genera claves adicionales haciendo clic en “+ Add New Key”.

Paso 5: Configura tu entorno de desarrollo y ajusta opciones como contenido, rol, nombre y prompt.

Integración de la API

Novita AI proporciona librerías cliente para Curl, Python y JavaScript, facilitando la integración de DeepSeek-R1 Instruct en tus proyectos:

Para usuarios de Python:

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<TU Clave API de Novita AI>",
)

model = "deepseek/deepseek_v3"
stream = True # o False
max_tokens = 8192
system_content = """Sé un asistente útil"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "¡Hola!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  

Para usuarios de JavaScript:

import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.novita.ai/v3/openai",
  apiKey: "<TU Clave API de Novita AI>",
});
const stream = true; // o false

async function run() {
  const completion = await openai.chat.completions.create({
    messages: [
      {
        role: "system",
        content: "Be a helpful assistant",
      },
      {
        role: "user",
        content: "Hi there!",
      },
    ],
    model: "deepseek/deepseek_v3",
    stream,
    response_format: { type: "text" },
    max_tokens: 8192,
    temperature: 1,
    top_p: 1,
    min_p: 0,
    top_k: 50,
    presence_penalty: 0,
    frequency_penalty: 0,
    repetition_penalty: 1
  });

  if (stream) {
    for await (const chunk of completion) {
      if (chunk.choices[0].finish_reason) {
        console.log(chunk.choices[0].finish_reason);
      } else {
        console.log(chunk.choices[0].delta.content);
      }
    }
  } else {
    console.log(JSON.stringify(completion));
  }
}

run();

Para usuarios de Curl:

curl "https://api.novita.ai/v3/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer <TU Clave API de Novita AI>" \
  -d @- << 'EOF'
{
    "model": "deepseek/deepseek_v3",
    "messages": [
        {
            "role": "system",
            "content": "Be a helpful assistant"
        },
        {
            "role": "user",
            "content": "Hi there!"
        }
    ],
    "response_format": { "type": "text" },
    "max_tokens": 8192,
    "temperature": 1,
    "top_p": 1,
    "min_p": 0,
    "top_k": 50,
    "presence_penalty": 0,
    "frequency_penalty": 0,
    "repetition_penalty": 1
}
EOF

Desbloquea el Poder de DeepSeek V3 Hoy

DeepSeek V3 representa un avance en la IA de código abierto, combinando escalabilidad, rentabilidad y un rendimiento excepcional. Junto con opciones de despliegue versátiles en GPUs y plataformas en la nube, DeepSeek V3 es una herramienta poderosa tanto para desarrolladores como para empresas.

Comienza con DeepSeek V3 en Novita AI hoy y desbloquea el potencial de la IA avanzada para tus proyectos.

Acerca de Novita AI

Novita AI es una plataforma de nube de IA que ofrece a los desarrolladores una manera fácil de implementar modelos de IA a través de nuestra API simple, al mismo tiempo que proporciona una nube de GPU asequible y confiable para la escalabilidad.