Comment accéder à DeepSeek R1 localement ou via l'API : un guide complet

Table des matières

Qu'est-ce que DeepSeek R1 ?
Comment accéder à DeepSeek R1 localement
Défis du déploiement local
Comment accéder à DeepSeek R1 via Novita AI
Quelles méthodes vous conviennent ?

Points clés

1. Performances avancées
Raisonnement supérieur : domine les benchmarks en mathématiques (AIME 2024, MATH-500) et en codage (Codeforces).
Architecture : MoE + entraînement renforcé par RL avec 671 milliards de paramètres (37B actifs par jeton).

2. Accès local via Ollama
Installez Ollama ; exécutez ollama run deepseek-r1:7b pour télécharger ; vérifiez avec ollama list et interagissez via le terminal.

3. Défis du déploiement local
Matériel : nécessite des GPU haut de gamme (par exemple H800) avec 24 Go+ de VRAM.
Mémoire : 671B paramètres ralentissent le chargement ; risques de swap disque.
Configuration : installation manuelle des poids, bibliothèques et configuration.
Modèles distillés : les versions plus petites (par exemple Qwen-32B) réduisent les ressources mais sacrifient les performances.

4. Accès via API : Novita AI propose une API pour DeepSeek R1. Il suffit de s’inscrire pour un essai gratuit et d’utiliser l’API avec des requêtes simples.

DeepSeek R1 est un modèle d’IA de pointe connu pour ses capacités de raisonnement solides, notamment en mathématiques et en codage. Cet article vous guidera à travers les différentes façons d’accéder à DeepSeek R1, soit en l’exécutant localement, soit en utilisant une API.

Qu’est-ce que DeepSeek R1 ?

Date de sortie : 21 janvier 2025
Échelle du modèle :
Fonctionnalités clés :
- Taille du modèle : 671B paramètres (37B actifs par jeton)
- Tokeniseur : tokeniseur amélioré avec balises d’auto-réflexion
- Langues supportées : multilingue avec adaptation culturelle
- Multimodal : texte uniquement
- Fenêtre de contexte : 128K jetons
- Formats de stockage : prise en charge de la quantification Q8/Q5
- Architecture : Mixture of Experts (MoE) + pipeline d’entraînement renforcé par RL
- Méthode d’entraînement : construit sur la base V3 avec pipeline RL (SFT → RL → SFT → RL)
- Données d’entraînement : base V3 + données d’optimisation RL

https://www.youtube.com/watch?v=ApvcIYDgXzg

Comparaison des benchmarks

DeepSeek-R1 démontre des performances supérieures dans la plupart des tests, en particulier dans les tâches nécessitant une grande précision et un raisonnement complexe (telles que AIME 2024, Codeforces, MATH-500 et MMLU). Il surpasse des modèles comme OpenAI-o1-1217 et OpenAI-o1-mini dans ces domaines. Cependant, DeepSeek-R1 montre des performances plus faibles dans des tâches spécifiques comme GPQA Diamond et SWE-bench Verified, indiquant des domaines potentiels d’amélioration par rapport à des modèles comme OpenAI O1.

Applications

Résolution de problèmes mathématiques et génération de code.
Tâches de raisonnement logique complexe.
Aide au diagnostic de problèmes complexes.
Analyse de scénarios multi-étapes.
Synthèse d’informations à partir de grands ensembles de données.
Applications de service client.

Comment accéder à DeepSeek R1 localement

https://www.youtube.com/watch?v=pbCQnDDj-bo

Guide d’installation étape par étape

1. Installer Ollama

Visitez le site Web d’Ollama, téléchargez et installez la version correspondant à votre système d’exploitation.

2. Télécharger le modèle DeepSeek-R1

Ouvrez votre terminal et exécutez (en utilisant la version à 7B de paramètres comme exemple) : bashCopyollama run deepseek-r1:7b (Attendez la fin du téléchargement ; la durée dépend de la vitesse du réseau.)

ollama run deepseek-r1:7b

3. Vérifier et exécuter

Vérifier l’installation :

ollama list  # Check if "deepseek-r1" appears in the list

Démarrer le modèle :

ollama run deepseek-r1:7b

4. Exemples d’utilisation

Poser une question : bashCopy>>> "Explain quantum computing in simple terms."
Générer du code : bashCopy>>> "Write a Python function to calculate the Fibonacci sequence."

Défis du déploiement local

1. Limitations matérielles

Exigences élevées en ressources :
- nécessite des GPU/TPU haut de gamme (par exemple H800) avec une VRAM/RAM substantielle.
Contraintes de mémoire :
- 671B paramètres (37B activés par jeton) entraînent un chargement lent.
- Une VRAM/RAM insuffisante provoque un swap disque ou un échec.

2. Installation et configuration

Installation complexe :
- Étapes manuelles : télécharger les poids du modèle (Hugging Face), installer les bibliothèques (par exemple transformers), configurer les frameworks.
- Nécessite une expertise technique pour l’optimisation.
Optimisation logicielle :
- Doit forcer les réponses à commencer par thinking\ pour garantir des schémas de raisonnement appropriés.

3. Goulets d’étranglement des performances

Inférence lente :
- Les limitations du CPU/GPU et la bande passante mémoire réduisent la vitesse de traitement.
Frais de maintenance :
- Les mises à jour manuelles pour les nouvelles versions du modèle ajoutent un effort continu.

4. Compromis avec les modèles distillés

Besoins en ressources réduits :
- Les versions plus petites (par exemple Qwen-32B, Llama-70B) réduisent les exigences matérielles.
- Exemple : Qwen-32B surpasse OpenAI-o1-mini dans les benchmarks.
Inconvénients de performance :
- Sacrifient la précision ou la capacité par rapport au modèle complet de 671B.
- Peuvent avoir des difficultés avec des tâches complexes nécessitant un raisonnement profond.

For Full Capability: Opt for API access to avoid hardware and setup challenges.

Comment accéder à DeepSeek R1 via Novita AI

Novita AI est une plateforme cloud d’IA qui offre aux développeurs un moyen facile de déployer des modèles d’IA en utilisant notre API simple, tout en fournissant un cloud GPU abordable et fiable pour construire et passer à l’échelle.

Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles

Connectez-vous à votre compte et cliquez sur le bouton Model Library.

Essayez la démo DeepSeek R1 maintenant !

Étape 2 : Choisissez votre modèle

Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Étape 3 : Commencez votre essai gratuit

Débutez votre essai gratuit pour explorer les capacités du modèle sélectionné.

Étape 4 : Obtenez votre clé API

Pour vous authentifier auprès de l’API, nous vous fournirons une nouvelle clé API. En accédant à la page « Settings », vous pouvez copier la clé API comme indiqué sur l’image.

Étape 5 : Installez l’API

Installez l’API à l’aide du gestionnaire de paquets spécifique à votre langage de programmation.

Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec Novita AI LLM. Ceci est un exemple d’utilisation de l’API chat completions pour les utilisateurs Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=&#91;
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices&#91;0].delta.content or "", end="")
else:
    print(chat_completion_res.choices&#91;0].message.content)

Lors de l’inscription, Novita AI offre un crédit de 0,5 $ pour vous lancer !

Si les crédits gratuits sont épuisés, vous pouvez payer pour continuer à l’utiliser.

Quelles méthodes vous conviennent ?

Chercheurs : L’accès local est généralement préféré pour la flexibilité et le contrôle sur les expériences.
Développeurs :
- L’accès via API est adapté pour créer des applications et du prototypage rapide.
- L’accès local est meilleur pour le fine-tuning et les workflows personnalisés.
Entreprises : L’accès via API est bénéfique pour une intégration rapide dans les services sans coûts initiaux élevés. Le déploiement local peut convenir aux équipes ayant des besoins constants et la capacité d’investir dans l’infrastructure.
Petites équipes/particuliers : L’accès via API est généralement plus pratique en raison des coûts de démarrage plus faibles.
Utilisateurs aux compétences techniques limitées : L’accès via API est préférable car il élimine le besoin de connaissances techniques approfondies.

En conclusion, DeepSeek R1 est un modèle impressionnant avec des capacités de raisonnement de pointe. Que vous choisissiez de l’exécuter localement ou d’utiliser une API, vous devrez considérer les compromis entre contrôle, coût et commodité. En examinant attentivement ces facteurs et les recommandations spécifiques de cet article, vous pouvez choisir la meilleure méthode d’accès pour vos objectifs.

Questions fréquemment posées

DeepSeek R1 est-il meilleur que le o1 d’OpenAI ?

DeepSeek R1 offre des performances comparables, en particulier dans les tâches de raisonnement, avec l’avantage supplémentaire d’être open source et plus économique.

Comment puis-je fine-tuner DeepSeek R1 ?

En tant que modèle open source, DeepSeek R1 peut être fine-tuné pour des tâches spécifiques, à condition de disposer des ressources informatiques et des données nécessaires.

Comment les modèles sont-ils entraînés ?

DeepSeek R1 est nettement moins cher que les modèles o1 d’OpenAI.

Novita AI est la plateforme cloud tout-en-un qui donne vie à vos ambitions en IA. APIs intégrées, serverless, instances GPU — les outils rentables dont vous avez besoin. Éliminez l’infrastructure, commencez gratuitement et faites de votre vision IA une réalité.

Comment accéder à DeepSeek R1 localement ou via l'API : un guide complet

Points clés

Qu’est-ce que DeepSeek R1 ?

Comparaison des benchmarks

Applications

Comment accéder à DeepSeek R1 localement

Guide d’installation étape par étape

1. Installer Ollama

2. Télécharger le modèle DeepSeek-R1

3. Vérifier et exécuter

4. Exemples d’utilisation

Défis du déploiement local

1. Limitations matérielles

2. Installation et configuration

3. Goulets d’étranglement des performances

4. Compromis avec les modèles distillés

Comment accéder à DeepSeek R1 via Novita AI

Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles

Étape 2 : Choisissez votre modèle

Étape 3 : Commencez votre essai gratuit

Étape 4 : Obtenez votre clé API

Étape 5 : Installez l’API

Quelles méthodes vous conviennent ?

Questions fréquemment posées

Lectures recommandées

Product

RESOURCES

Partners

Company

Points clés

Qu’est-ce que DeepSeek R1 ?

Comparaison des benchmarks

Applications

Comment accéder à DeepSeek R1 localement

Guide d’installation étape par étape

1. Installer Ollama

2. Télécharger le modèle DeepSeek-R1

3. Vérifier et exécuter

4. Exemples d’utilisation

Défis du déploiement local

1. Limitations matérielles

2. Installation et configuration

3. Goulets d’étranglement des performances

4. Compromis avec les modèles distillés

Comment accéder à DeepSeek R1 via Novita AI

Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles

Étape 2 : Choisissez votre modèle

Étape 3 : Commencez votre essai gratuit

Étape 4 : Obtenez votre clé API

Étape 5 : Installez l’API

Quelles méthodes vous conviennent ?

Questions fréquemment posées

Lectures recommandées

Articles associés

Product

RESOURCES

Partners

Company