DeepSeek V3.1 est le tout nouveau modèle phare de DeepSeek, conçu pour faire progresser les performances de l’IA avec une architecture de raisonnement hybride, une efficacité de réflexion accrue et des capacités agent plus fortes. Ces innovations offrent aux développeurs une base puissante pour créer des applications plus intelligentes et rationaliser les tâches du monde réel.
Ce guide vous présentera DeepSeek V3.1, mettra en évidence ses fonctionnalités principales et ses performances de référence, et vous montrera comment y accéder via un déploiement local, des API et des plateformes tierces.
Démarrez votre essai gratuit avec DeepSeek V3.1 !
Introduction de base
| Caractéristique | Détail |
| Nombre total de paramètres | 671B |
| Paramètres activés | 37B |
| Longueur du contexte | 128K |
| Architecture | MoE basée sur Transformer |
| Mode de réflexion | Mode de réflexion hybride (Think + Non-Think) |
| Licence | Licence MIT |
Benchmarks

DeepSeek V3.1 (Reasoning) excelle dans les tâches exigeantes telles que les mathématiques de compétition AIME et le raisonnement scientifique GPQA, offrant une construction de chaîne logique plus robuste, une meilleure compréhension du contexte long et des réponses plus cohérentes, ce qui le rend idéal pour les applications à haute précision et axées sur la profondeur.
DeepSeek V3.1 (Non-Reasoning) offre des performances équilibrées avec une efficacité et un rapport coût-efficacité accrus pour les charges de travail générales. Ensemble, ils permettent aux développeurs de choisir flexiblement entre la profondeur de raisonnement rigoureuse et l’efficacité pratique à usage général.
Principales améliorations
- Inférence hybride : DeepSeek V3.1 réunit les modes Think et Non-Think en un seul modèle.
- Réflexion plus rapide : DeepSeek V3.1 Think atteint une qualité de réponse comparable à DeepSeek-R1-0528, tout en répondant plus rapidement.
- Compétences agent renforcées : DeepSeek V3.1 exploite le post-entraînement pour améliorer l’utilisation des outils et gérer des tâches complexes en plusieurs étapes.
Comment accéder à DeepSeek V3.1 : Déploiement local
Configuration requise pour DeepSeek V3.1
| Type | VRAM (approx.) | Matériel recommandé |
| 1-bit | 186 Go | GPU haut de gamme unique / Serveurs multi-GPU |
| 2-bit | 219 Go | Serveurs multi-GPU |
| 3-bit | 319 Go | Serveurs multi-GPU |
| 4-bit | 404 Go | Serveurs multi-GPU |
| 8-bit | 713 Go | Grands clusters de GPU |
| 16-bit (BF16) | 1,34 To | Cluster Nvidia H200 8 cartes |
DeepSeek V3.1 prend en charge le déploiement local avec le matériel suivant et les logiciels de la communauté open source.
- DeepSeek-Infer Demo : Une démo simple et légère pour l’inférence FP8 et BF16.
- SGLang : Prise en charge complète de DeepSeek-V3 en modes BF16 et FP8, avec Multi-Token Prediction à venir.
- LMDeploy : Fournit une inférence efficace FP8 et BF16 pour le déploiement local et cloud.
- TensorRT-LLM : Prend actuellement en charge l’inférence BF16 et la quantification INT4/INT8, avec le support FP8 en cours.
- vLLM : Prend en charge DeepSeek-V3 avec FP8 et BF16 pour le parallélisme tensoriel et le parallélisme de pipeline.
- LightLLM : Offre un déploiement efficace sur un seul nœud ou plusieurs nœuds pour FP8 et BF16.
- GPU AMD : Exécute DeepSeek-V3 sur des GPU AMD via SGLang en modes BF16 et FP8.
- Huawei Ascend NPU : Exécute DeepSeek-V3 sur des appareils Huawei Ascend en modes INT8 et BF16.
Bien que DeepSeek V3.1 puisse être déployé localement avec des exigences matérielles importantes, Novita AI propose également des solutions GPU cloud optimisées (H100 et H200), éliminant le besoin de gérer une infrastructure complexe.
Comment accéder à DeepSeek V3.1 : Utiliser l’API
Novita AI fournit des API DeepSeek V3.1 avec contexte de 163,8K et des coûts de 0,55 $ / 1M tokens d’entrée et 1,66 $ / 1M tokens de sortie .
Option 1 : Intégration API directe (Exemple Python)
Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles
Connectez-vous ou créez un compte, puis cliquez sur le bouton Model Library.

Essayez DeepSeek V3.1 maintenant !
Étape 2 : Choisissez votre modèle
Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Étape 3 : Démarrez votre essai gratuit
Commencez votre essai gratuit pour explorer les capacités du modèle sélectionné.

Étape 4 : Obtenez votre clé API
Pour vous authentifier auprès de l’API, nous vous fournirons une nouvelle clé API. Rendez-vous dans la page « Paramètres » et copiez la clé API comme indiqué dans l’image.

Étape 5 : Installez l’API
Installez l’API à l’aide du gestionnaire de paquets propre à votre langage de programmation.
Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec Novita AI LLM. Voici un exemple d’utilisation de l’API chat completions pour les utilisateurs Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="",
)
model = "deepseek/deepseek-v3.1"
stream = True # or False
max_tokens = 81920
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Option 2 : Workflows multi-agents avec OpenAI Agents SDK
Construisez des systèmes multi-agents sophistiqués exploitant les capacités double-mode de DeepSeek-V3.1 :
- Intégration plug-and-play : Utilisez DeepSeek V3.1 dans n’importe quel workflow OpenAI Agents
- Capacités agent avancées : Prise en charge des transferts, du routage et de l’intégration d’outils
- Architecture évolutive : Concevez des agents qui exploitent les capacités de DeepSeek V3.1
Comment accéder à DeepSeek V3.1 : Intégration avec Claude Code
Étape 1 : Installation de Claude Code
Avant d’installer Claude Code, assurez-vous que votre système répond aux exigences minimales. Node.js 18 ou supérieur doit être installé dans votre environnement local. Vous pouvez vérifier votre version de Node.js en exécutant node --version dans votre terminal.
Ouvrez l’invite de commandes (Windows) ou le terminal (Mac/Linux) et exécutez :
npm install -g @anthropic-ai/claude-code
L’installation globale garantit que Claude Code est accessible depuis n’importe quel répertoire de votre système. Le processus d’installation configure automatiquement les dépendances nécessaires et les variables PATH sur toutes les plateformes.
Étape 2 : Configuration des variables d’environnement
Les variables d’environnement configurent Claude Code pour utiliser DeepSeek V3.1 via les points de terminaison API de Novita AI. Ces variables indiquent à Claude Code où envoyer les requêtes et comment s’authentifier.
- Pour Windows
Ouvrez l’invite de commandes et définissez les variables d’environnement suivantes :
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL=deepseek/deepseek-v3.1
set ANTHROPIC_SMALL_FAST_MODEL=deepseek/deepseek-v3.1
Remplacez <Novita API Key> par votre clé API réelle obtenue depuis la plateforme Novita AI. Ces variables restent actives pour la session en cours et doivent être redéfinies si vous fermez l’invite de commandes.
- Pour Mac et Linux
Ouvrez le terminal et exportez les variables d’environnement suivantes :
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.1"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.1"
Étape 3 : Démarrage de Claude Code
Une fois l’installation et la configuration terminées, vous pouvez démarrer Claude Code dans votre répertoire de projet. Naviguez vers l’emplacement de votre projet souhaité à l’aide de la commande cd :
cd <your-project-directory>
claude .
Le paramètre point (.) indique à Claude Code d’opérer dans le répertoire courant. Au démarrage, vous verrez l’invite Claude Code apparaître dans une session interactive.
Cela indique que l’outil est prêt à recevoir vos instructions. L’interface offre un environnement propre et intuitif pour les interactions de programmation en langage naturel.
Étape 4 : Construction de votre premier projet
Claude Code excelle dans la transformation de descriptions détaillées de projets en applications fonctionnelles. Après avoir saisi votre invite, appuyez sur Entrée pour commencer la tâche. Claude Code analysera vos besoins, créera les fichiers nécessaires, implémentera la fonctionnalité et fournira une structure de projet complète avec documentation.
Comment accéder à DeepSeek V3.1 : Se connecter avec d’autres plateformes tierces
Outils de développement : Intégration transparente avec les IDE et environnements de développement populaires comme Cursor, Trae, Qwen Code et Cline via des API compatibles OpenAI et Anthropic.
Frameworks d’orchestration : Connectez-vous avec LangChain, Dify, CrewAI, Langflow et d’autres plateformes d’orchestration IA à l’aide de connecteurs officiels.
Intégration Hugging Face : Novita AI sert de fournisseur d’inférence officiel de Hugging Face, garantissant une large compatibilité avec l’écosystème.
FAQ
Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles IA via notre API simple, tout en fournissant un cloud GPU abordable et fiable pour construire et faire évoluer.
Lectures recommandées
DeepSeek R1 7B : 90 % de la puissance de DeepSeek R1 avec 10 fois plus d’efficacité matérielle
