DeepSeek V3 : Avancer les modèles de code open-source, désormais disponibles sur Novita AI

Table des matières

Qu'est-ce que DeepSeek V3 ?
Principales caractéristiques de DeepSeek V3
Performances de DeepSeek V3 sur les benchmarks
Options de déploiement pour DeepSeek V3
Accédez à l'API DeepSeek V3 via Novita AI
Libérez la puissance de DeepSeek V3 dès aujourd'hui

Le monde de l’innovation open-source fait un bond en avant avec la sortie de DeepSeek V3, un modèle avancé de génération de code qui promet de redéfinir la façon dont les développeurs abordent les tâches de programmation. Désormais disponible sur Novita AI, ce modèle révolutionnaire est conçu pour offrir aux développeurs, chercheurs et passionnés de technologie des capacités inégalées.

Qu’est-ce que DeepSeek V3 ?

DeepSeek V3 est un modèle de langage à grande échelle de type Mixture-of-Experts (MoE) de pointe, fort de 671 milliards de paramètres, dont 37 milliards activés par jeton lors de l’inférence. Publié en tant que modèle open-source, il permet aux développeurs de relever des défis complexes en matière de codage, de raisonnement, de mathématiques et de génération de texte.

DeepSeek V3 se distingue par son architecture efficace et son entraînement rentable. Son entraînement n’a nécessité que 2,788 millions d’heures GPU H800, coûtant environ 5,5 millions de dollars, bien moins que les ressources nécessaires pour des modèles propriétaires comparables comme GPT-4. En intégrant des techniques innovantes telles que l’attention multi-têtes latente (MLA) et la prédiction multi-tokens (MTP), DeepSeek V3 offre des performances exceptionnelles tout en restant évolutif et accessible.

Principales caractéristiques de DeepSeek V3

1. Architecture Mixture-of-Experts (MoE)

DeepSeek V3 utilise un cadre MoE avec des techniques fines d’équilibrage dynamique de la charge. Contrairement aux modèles MoE traditionnels, il élimine le besoin de perte auxiliaire, garantissant une distribution efficace des ressources de calcul sans dégradation des performances.

2. Attention multi-têtes latente (MLA)

MLA améliore l’efficacité de l’inférence en compressant les clés et valeurs d’attention, réduisant ainsi la surcharge mémoire tout en maintenant une haute qualité d’attention. Cela permet à DeepSeek V3 de gérer des fenêtres de contexte allant jusqu’à 128 000 tokens, ce qui le rend idéal pour les tâches impliquant de longs textes en entrée.

3. Prédiction multi-tokens (MTP)

L’objectif MTP permet à DeepSeek V3 de prédire plusieurs tokens simultanément, améliorant à la fois l’efficacité de l’entraînement et la vitesse d’inférence. Cette fonctionnalité est particulièrement utile pour générer du contenu long ou résoudre des problèmes complexes.

4. Entraînement en précision mixte FP8

DeepSeek V3 utilise la précision FP8 (virgule flottante sur 8 bits) pour l’entraînement, réduisant les coûts mémoire et de calcul tout en maintenant la stabilité numérique. Cette innovation permet au modèle de monter en échelle efficacement sans nécessiter une grande empreinte matérielle.

5. Prise en charge des langues anglaise et chinoise

DeepSeek V3 est optimisé pour l’anglais et le chinois, ce qui en fait un excellent choix pour les développeurs créant des applications multilingues pour ces deux langues largement utilisées. Bien qu’il ne prenne pas en charge un large éventail de langues, il excelle dans ces domaines spécifiques.

Performances de DeepSeek V3 sur les benchmarks

DeepSeek V3 surpasse systématiquement de nombreux modèles open-source et même propriétaires sur divers benchmarks. Voici une comparaison de ses performances :

Excellence en codage :
- DeepSeek V3 atteint 82,6 % sur HumanEval-Mul (Pass@1) et 51,6 % sur Codeforces, ce qui en fait une solution robuste pour les tâches de génération et d’évaluation de code.
- Sur LiveCodeBench (Pass@1-COT), il dépasse largement ses prédécesseurs avec 40,5 %, et se montre compétitif face aux autres modèles.
Raisonnement mathématique :
- DeepSeek V3 est en tête sur MATH-500 (90,2 %) et affiche de bonnes performances sur CNMO 2024 (Pass@1) et AIME 2024, démontrant sa capacité à résoudre des problèmes mathématiques avancés.
Capacités multilingues :
- Avec 90,9 % sur CLUEWSC et 86,5 % sur C-Eval, DeepSeek V3 se positionne comme un excellent modèle pour les tâches spécifiques au chinois, tout en conservant des performances solides sur les benchmarks anglais comme MMLU (88,5 %).
Connaissances générales et raisonnement :
- Il obtient 91,6 % sur DROP (3-shot F1) et 89,1 % sur MMLU-Redux, démontrant son utilité pour les applications intensives en connaissances.

Essayez la démo de DeepSeek V3 dès maintenant

Options de déploiement pour DeepSeek V3

DeepSeek V3 offre une flexibilité de déploiement, permettant aux utilisateurs de l’intégrer facilement dans leurs workflows. Que vous préfériez l’exécuter localement ou dans le cloud, le modèle prend en charge une variété de matériels et d’outils logiciels de la communauté open-source. Voici les options recommandées pour le déploiement :

DeepSeek-Infer Demo : Une démo simple et légère pour l’inférence FP8 et BF16, offrant un moyen facile de tester le modèle.
SGLang : Prend entièrement en charge le modèle DeepSeek-V3 en modes d’inférence BF16 et FP8, avec un support de la prédiction multi-tokens à venir.
LMDeploy : Permet une inférence efficace FP8 et BF16 pour un déploiement local et cloud.
TensorRT-LLM : Prend actuellement en charge l’inférence BF16 et la quantification INT4/INT8, avec un support FP8 prévu dans les futures mises à jour.
vLLM : Prend en charge DeepSeek V3 en modes FP8 et BF16, permettant le parallélisme tensoriel et le parallélisme de pipeline pour une mise à l’échelle efficace.

Accédez à l’API DeepSeek V3 via Novita AI

La plateforme Novita AI simplifie le déploiement de DeepSeek V3 en fournissant des API préconfigurées et une infrastructure cloud GPU abordable. Les développeurs peuvent intégrer le modèle de manière transparente dans leurs applications sans se soucier de la configuration matérielle ou de la mise à l’échelle.

Pour commencer avec DeepSeek V3 sur Novita AI, suivez ces étapes :

Étape 1 : Rendez-vous sur Novita AI et connectez-vous en utilisant votre compte Google, GitHub ou votre adresse e-mail.

Étape 2 : Essayez la démo de DeepSeek V3.

Étape 3 : Surveillez la console de métriques LLM du modèle sur Novita AI.

Étape 4 : Obtenez votre clé API :

Accédez à « Gestion des clés » dans les paramètres.
Une clé par défaut est créée lors de votre première connexion.
Générez des clés supplémentaires en cliquant sur « + Ajouter une nouvelle clé ».

Étape 5 : Configurez votre environnement de développement et paramétrez des options telles que le contenu, le rôle, le nom et l’invite.

Intégration API

Novita AI fournit des bibliothèques clientes pour Curl, Python et JavaScript, facilitant l’intégration de DeepSeek-R1 Instruct dans vos projets :

Pour les utilisateurs Python :

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_v3"
stream = True # or False
max_tokens = 8192
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Pour les utilisateurs JavaScript :

import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.novita.ai/v3/openai",
  apiKey: "<YOUR Novita AI API Key>",
});
const stream = true; // or false

async function run() {
  const completion = await openai.chat.completions.create({
    messages: [
      {
        role: "system",
        content: "Be a helpful assistant",
      },
      {
        role: "user",
        content: "Hi there!",
      },
    ],
    model: "deepseek/deepseek_v3",
    stream,
    response_format: { type: "text" },
    max_tokens: 8192,
    temperature: 1,
    top_p: 1,
    min_p: 0,
    top_k: 50,
    presence_penalty: 0,
    frequency_penalty: 0,
    repetition_penalty: 1
  });

  if (stream) {
    for await (const chunk of completion) {
      if (chunk.choices[0].finish_reason) {
        console.log(chunk.choices[0].finish_reason);
      } else {
        console.log(chunk.choices[0].delta.content);
      }
    }
  } else {
    console.log(JSON.stringify(completion));
  }
}

run();

Pour les utilisateurs Curl :

curl "https://api.novita.ai/v3/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer <YOUR Novita AI API Key>" \
  -d @- << 'EOF'
{
    "model": "deepseek/deepseek_v3",
    "messages": [
        {
            "role": "system",
            "content": "Be a helpful assistant"
        },
        {
            "role": "user",
            "content": "Hi there!"
        }
    ],
    "response_format": { "type": "text" },
    "max_tokens": 8192,
    "temperature": 1,
    "top_p": 1,
    "min_p": 0,
    "top_k": 50,
    "presence_penalty": 0,
    "frequency_penalty": 0,
    "repetition_penalty": 1
}
EOF

Libérez la puissance de DeepSeek V3 dès aujourd’hui

DeepSeek V3 représente une avancée majeure dans l’IA open-source, combinant évolutivité, rentabilité et performances exceptionnelles. Avec des options de déploiement polyvalentes sur GPU et plateformes cloud, DeepSeek V3 est un outil puissant pour les développeurs comme pour les entreprises.

Commencez dès maintenant avec DeepSeek V3 sur Novita AI et libérez le potentiel de l’IA avancée pour vos projets.

À propos de Novita AI

Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles d’IA via notre API simple, tout en fournissant un cloud GPU abordable et fiable pour la mise à l’échelle.

DeepSeek V3 : Avancer les modèles de code open-source, désormais disponibles sur Novita AI

Qu’est-ce que DeepSeek V3 ?

Principales caractéristiques de DeepSeek V3

1. Architecture Mixture-of-Experts (MoE)

2. Attention multi-têtes latente (MLA)

3. Prédiction multi-tokens (MTP)

4. Entraînement en précision mixte FP8

5. Prise en charge des langues anglaise et chinoise

Performances de DeepSeek V3 sur les benchmarks

Options de déploiement pour DeepSeek V3

Accédez à l’API DeepSeek V3 via Novita AI

Intégration API

Libérez la puissance de DeepSeek V3 dès aujourd’hui

Product

RESOURCES

Partners

Company

Qu’est-ce que DeepSeek V3 ?

Principales caractéristiques de DeepSeek V3

1. Architecture Mixture-of-Experts (MoE)

2. Attention multi-têtes latente (MLA)

3. Prédiction multi-tokens (MTP)

4. Entraînement en précision mixte FP8

5. Prise en charge des langues anglaise et chinoise

Performances de DeepSeek V3 sur les benchmarks

Options de déploiement pour DeepSeek V3

Accédez à l’API DeepSeek V3 via Novita AI

Intégration API

Libérez la puissance de DeepSeek V3 dès aujourd’hui

Articles associés

Product

RESOURCES

Partners

Company