Faits saillants
1. Performances avancées
Raisonnement supérieur:Domine les tests de mathématiques (AIME 2024, MATH-500) et de codage (Codeforces).
Architecture: MoE + formation améliorée par RL avec 671 B de paramètres (37 B actifs/jeton).
2. Accès local via Ollama
Installer Ollama; Courir ollama run deepseek-r1:7b à télécharger ; Vérifier avec ollama list et interagir via le terminal.
3. Défis du déploiement local
Hardware: Nécessite du haut de gamme GPUs (par exemple, H800) avec 24 Go+ VRAM.
Mémoire:Les paramètres 671B ralentissent le chargement ; risques d'échange de disque.
installation:Installation manuelle des poids, des bibliothèques et de la configuration.
Modèles distillés:Les versions plus petites (par exemple, Qwen-32B) réduisent les ressources mais sacrifient les performances.
4. Accès API: Novita AI propose une API pour DeepSeek R1Inscrivez-vous simplement pour un essai gratuit et utilisez l'API avec des requêtes simples.
DeepSeek R1 est un modèle d'IA de pointe connu pour ses fortes capacités de raisonnement, notamment en mathématiques et en codage. Cet article vous guidera à travers les différentes manières d'accéder à DeepSeek R1, soit en l'exécutant localement, soit en utilisant une API.
Qu'est-ce que DeepSeek R1 ?
- Date de sortie: Janvier 21, 2025
- Échelle du modèle :
- Caractéristiques principales:
- Taille du modèle: 671B paramètres (37B actifs/jeton)
- Générateur de jetons: Tokenizer amélioré avec des balises d'auto-réflexion
- Langues prises en charge:Multilingue avec adaptation culturelle
- multimodal: Texte uniquement
- Fenêtre contextuelle: 128 XNUMX jetons
- Formats de stockage: Prise en charge de la quantification Q8/Q5
- Architecture: Mélange d'experts (MoE) + pipeline de formation amélioré par RL
- Méthode de formation:Construit sur la base V3 avec pipeline RL (SFT → RL → SFT → RL)
- Données d'entraînement: Base V3 + données d'optimisation RL
Comparaison des indices de référence

DeepSeek-R1 affiche des performances supérieures dans la plupart des tests, en particulier dans les tâches nécessitant une grande précision et un raisonnement complexe (comme AIME 2024, Codeforces, MATH-500 et MMLU). Il surpasse des modèles comme OpenAI-o1-1217 et OpenAI-o1-mini dans ces domaines. Cependant, DeepSeek-R1 affiche des performances plus faibles dans des tâches spécifiques comme GPQA Diamond et SWE-bench Verified, ce qui indique des domaines potentiels d'amélioration par rapport à des modèles comme Open AI O1.
Applications
- Résolution de problèmes mathématiques et génération de code.
- Tâches complexes de raisonnement logique.
- Aider au diagnostic de problèmes complexes.
- Analyser des scénarios à plusieurs étapes.
- Synthétiser les informations issues de grands ensembles de données.
- Applications de service client.
Comment accéder à DeepSeek R1 localement
Guide d'Installation Étape par Étape
1. Installer Ollama
- Rendez-vous sur Site Internet d'Ollama, téléchargez et installez la version adaptée à votre système d'exploitation.
2. Téléchargez le modèle DeepSeek-R1
- Ouvrez votre terminal et exécutez (en utilisant la version du paramètre 7B comme exemple) : bashCopy
ollama run deepseek-r1:7b(Attendez la fin du téléchargement ; le temps dépend de la vitesse du réseau.)
ollama run deepseek-r1:7b
3. Vérifier et exécuter
- Vérifier l'installation:
ollama list # Check if "deepseek-r1" appears in the list
- Démarrer le modèle:
ollama run deepseek-r1:7b
4. Exemples d'utilisation
- Poser une question: bashCopier
>>> "Explain quantum computing in simple terms." - Générer du code: bashCopier
>>> "Write a Python function to calculate the Fibonacci sequence."
Les défis du déploiement local
1. Limites matérielles
- Demandes élevées en ressources:
- Nécessite du haut de gamme GPUs/TPU (par exemple, H800) avec une VRAM/RAM substantielle.
- Contraintes de mémoire:
- Les paramètres 671B (37B activés par jeton) entraînent un chargement lent.
- Une VRAM/RAM insuffisante provoque un échange ou une panne du disque.
2. Installation et configuration
- Installation complexe:
- Étapes manuelles : téléchargez les poids du modèle (Hugging Face), installez les bibliothèques (par exemple,
transformers), configurer les frameworks. - Nécessite une expertise technique pour l'optimisation.
- Étapes manuelles : téléchargez les poids du modèle (Hugging Face), installez les bibliothèques (par exemple,
- Optimisation logicielle:
- Il faut forcer les réponses à commencer par
<think>\npour garantir des modèles de raisonnement appropriés.
- Il faut forcer les réponses à commencer par
3. Goulots d’étranglement en matière de performances
- Inférence lente:
- CPU/GPU les limitations et la bande passante mémoire réduisent la vitesse de traitement.
- Frais généraux de maintenance:
- Les mises à jour manuelles pour les nouvelles versions de modèles nécessitent un effort continu.
4. Compromis avec les modèles distillés
- Besoins en ressources réduits:
- Les versions plus petites (par exemple, Qwen-32B, Llama-70B) réduisent les exigences matérielles.
- Exemple : Qwen-32B surpasse OpenAI-o1-mini dans les benchmarks.
- Inconvénients en termes de performances:
- Sacrifiez la précision ou la capacité par rapport au modèle 671B complet.
- Peut avoir des difficultés avec des tâches complexes nécessitant un raisonnement approfondi.
Pour une fonctionnalité complète : optez pour l'accès API pour éviter les problèmes de matériel et de configuration.
Comment accéder à DeepSeek R1 via Novita AI
Novita AI est une plateforme cloud d'IA qui offre aux développeurs un moyen simple de déployer des modèles d'IA à l'aide de notre API simple, tout en fournissant une solution abordable et fiable GPU Cloud pour la construction et la mise à l'échelle.
Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles
Connectez-vous à votre compte et cliquez sur le bouton Bibliothèque de modèles .

Étape 2 : Choisissez votre modèle
Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Étape 3 : Démarrez votre essai gratuit
Commencez votre essai gratuit pour explorer les capacités du modèle sélectionné.

Étape 4 : obtenez votre clé API
Pour vous authentifier auprès de l'API, nous vous fournirons une nouvelle clé API. En accédant à la page « Paramètres », vous pouvez copier la clé API comme indiqué dans l'image.

Étape 5 : Installer l’API
Installez l'API à l'aide du gestionnaire de packages spécifique à votre langage de programmation.

Après l'installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l'API avec votre clé API pour commencer à interagir avec Novita AI LLMCeci est un exemple d'utilisation de l'API de complétion de chat pour les utilisateurs de Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "deepseek/deepseek_r1"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Dès l'inscription, Novita AI offre un crédit de 0.5 $ pour vous aider à démarrer !
Si les crédits gratuits sont épuisés, vous pouvez payer pour continuer à les utiliser.
Quelles méthodes vous conviennent ?
- Des chercheurs: L'accès local est généralement préféré pour la flexibilité et le contrôle des expériences.
- Développeurs
- L'accès API est adapté à la création d'applications et au prototypage rapide.
- L'accès local est plus adapté aux réglages précis et aux flux de travail personnalisés.
- Professionnels: L'accès aux API est bénéfique pour une intégration rapide dans les services sans coûts initiaux élevés. Le déploiement local peut convenir aux équipes ayant des exigences cohérentes et la capacité d'investir dans l'infrastructure.
- Petites équipes/individus : L’accès aux API est généralement plus pratique en raison des coûts de démarrage inférieurs.
- Utilisateurs ayant des compétences techniques limitées : L’accès API est préférable car il élimine le besoin de connaissances techniques approfondies.
En conclusion, DeepSeek R1 est un modèle impressionnant doté de capacités de raisonnement de pointe. Que vous choisissiez de l'exécuter localement ou d'utiliser une API, vous devrez tenir compte des compromis entre contrôle, coût et commodité. En examinant attentivement ces facteurs et les recommandations spécifiques de cet article, vous pouvez choisir la meilleure méthode d'accès pour vos objectifs.
Questions fréquemment posées
eepSeek R1 offre des performances comparables, notamment dans les tâches de raisonnement, avec l'avantage supplémentaire d'être open source et plus rentable.
En tant que modèle open source, DeepSeek R1 peut être affiné pour des tâches spécifiques, à condition que vous disposiez des ressources de calcul et des données.
DeepSeek R1 est nettement moins cher que les modèles o1 d'OpenAI.
Novita AI est la plateforme cloud tout-en-un qui concrétise vos ambitions en matière d'IA. API intégrées, sans serveur, GPU Instance : les outils économiques dont vous avez besoin. Éliminez l'infrastructure, démarrez gratuitement et concrétisez votre vision de l'IA.
Recommander la lecture
- DeepSeek V3 : faire progresser les modèles de code open source, désormais disponible sur Novita AI
- Deepseek v3 vs Llama 3.3 70b : tâches linguistiques vs code et mathématiques
- Llama 3.2 3B vs DeepSeek V3 : comparaison de l'efficacité et des performances.
Découvrez-en plus sur Novita
Abonnez-vous pour recevoir les derniers articles envoyés à votre adresse e-mail.





