Comment accéder à DeepSeek V3.1 : Guide complet

Table des matières

Introduction de base
Benchmarks
Principales améliorations
Comment accéder à DeepSeek V3.1 : Déploiement local
Comment accéder à DeepSeek V3.1 : Utiliser l'API
Comment accéder à DeepSeek V3.1 : Intégration avec Claude Code
Comment accéder à DeepSeek V3.1 : Se connecter avec d'autres plateformes tierces

DeepSeek V3.1 est le tout nouveau modèle phare de DeepSeek, conçu pour faire progresser les performances de l’IA avec une architecture de raisonnement hybride, une efficacité de réflexion accrue et des capacités agent plus fortes. Ces innovations offrent aux développeurs une base puissante pour créer des applications plus intelligentes et rationaliser les tâches du monde réel.

Ce guide vous présentera DeepSeek V3.1, mettra en évidence ses fonctionnalités principales et ses performances de référence, et vous montrera comment y accéder via un déploiement local, des API et des plateformes tierces.

Démarrez votre essai gratuit avec DeepSeek V3.1 !

Introduction de base


Caractéristique	Détail
Nombre total de paramètres	671B
Paramètres activés	37B
Longueur du contexte	128K
Architecture	MoE basée sur Transformer
Mode de réflexion	Mode de réflexion hybride (Think + Non-Think)
Licence	Licence MIT

Benchmarks

DeepSeek V3.1 (Reasoning) excelle dans les tâches exigeantes telles que les mathématiques de compétition AIME et le raisonnement scientifique GPQA, offrant une construction de chaîne logique plus robuste, une meilleure compréhension du contexte long et des réponses plus cohérentes, ce qui le rend idéal pour les applications à haute précision et axées sur la profondeur.

DeepSeek V3.1 (Non-Reasoning) offre des performances équilibrées avec une efficacité et un rapport coût-efficacité accrus pour les charges de travail générales. Ensemble, ils permettent aux développeurs de choisir flexiblement entre la profondeur de raisonnement rigoureuse et l’efficacité pratique à usage général.

Principales améliorations

Inférence hybride : DeepSeek V3.1 réunit les modes Think et Non-Think en un seul modèle.
Réflexion plus rapide : DeepSeek V3.1 Think atteint une qualité de réponse comparable à DeepSeek-R1-0528, tout en répondant plus rapidement.
Compétences agent renforcées : DeepSeek V3.1 exploite le post-entraînement pour améliorer l’utilisation des outils et gérer des tâches complexes en plusieurs étapes.

Comment accéder à DeepSeek V3.1 : Déploiement local

Configuration requise pour DeepSeek V3.1


Type	VRAM (approx.)	Matériel recommandé
1-bit	186 Go	GPU haut de gamme unique / Serveurs multi-GPU
2-bit	219 Go	Serveurs multi-GPU
3-bit	319 Go	Serveurs multi-GPU
4-bit	404 Go	Serveurs multi-GPU
8-bit	713 Go	Grands clusters de GPU
16-bit (BF16)	1,34 To	Cluster Nvidia H200 8 cartes

DeepSeek V3.1 prend en charge le déploiement local avec le matériel suivant et les logiciels de la communauté open source.

DeepSeek-Infer Demo : Une démo simple et légère pour l’inférence FP8 et BF16.
SGLang : Prise en charge complète de DeepSeek-V3 en modes BF16 et FP8, avec Multi-Token Prediction à venir.
LMDeploy : Fournit une inférence efficace FP8 et BF16 pour le déploiement local et cloud.
TensorRT-LLM : Prend actuellement en charge l’inférence BF16 et la quantification INT4/INT8, avec le support FP8 en cours.
vLLM : Prend en charge DeepSeek-V3 avec FP8 et BF16 pour le parallélisme tensoriel et le parallélisme de pipeline.
LightLLM : Offre un déploiement efficace sur un seul nœud ou plusieurs nœuds pour FP8 et BF16.
GPU AMD : Exécute DeepSeek-V3 sur des GPU AMD via SGLang en modes BF16 et FP8.
Huawei Ascend NPU : Exécute DeepSeek-V3 sur des appareils Huawei Ascend en modes INT8 et BF16.

Bien que DeepSeek V3.1 puisse être déployé localement avec des exigences matérielles importantes, Novita AI propose également des solutions GPU cloud optimisées (H100 et H200), éliminant le besoin de gérer une infrastructure complexe.

Comment accéder à DeepSeek V3.1 : Utiliser l’API

Novita AI fournit des API DeepSeek V3.1 avec contexte de 163,8K et des coûts de 0,55 $ / 1M tokens d’entrée et 1,66 $ / 1M tokens de sortie .

Option 1 : Intégration API directe (Exemple Python)

Étape 1 : Connectez-vous et accédez à la bibliothèque de modèles

Connectez-vous ou créez un compte, puis cliquez sur le bouton Model Library.

Essayez DeepSeek V3.1 maintenant !

Étape 2 : Choisissez votre modèle

Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Étape 3 : Démarrez votre essai gratuit

Commencez votre essai gratuit pour explorer les capacités du modèle sélectionné.

Étape 4 : Obtenez votre clé API

Pour vous authentifier auprès de l’API, nous vous fournirons une nouvelle clé API. Rendez-vous dans la page « Paramètres » et copiez la clé API comme indiqué dans l’image.

Étape 5 : Installez l’API

Installez l’API à l’aide du gestionnaire de paquets propre à votre langage de programmation.

Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec Novita AI LLM. Voici un exemple d’utilisation de l’API chat completions pour les utilisateurs Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/openai",
    api_key="",
)

model = "deepseek/deepseek-v3.1"
stream = True # or False
max_tokens = 81920
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Option 2 : Workflows multi-agents avec OpenAI Agents SDK

Construisez des systèmes multi-agents sophistiqués exploitant les capacités double-mode de DeepSeek-V3.1 :

Intégration plug-and-play : Utilisez DeepSeek V3.1 dans n’importe quel workflow OpenAI Agents
Capacités agent avancées : Prise en charge des transferts, du routage et de l’intégration d’outils
Architecture évolutive : Concevez des agents qui exploitent les capacités de DeepSeek V3.1

Comment accéder à DeepSeek V3.1 : Intégration avec Claude Code

Étape 1 : Installation de Claude Code

Avant d’installer Claude Code, assurez-vous que votre système répond aux exigences minimales. Node.js 18 ou supérieur doit être installé dans votre environnement local. Vous pouvez vérifier votre version de Node.js en exécutant node --version dans votre terminal.

Ouvrez l’invite de commandes (Windows) ou le terminal (Mac/Linux) et exécutez :

npm install -g @anthropic-ai/claude-code

L’installation globale garantit que Claude Code est accessible depuis n’importe quel répertoire de votre système. Le processus d’installation configure automatiquement les dépendances nécessaires et les variables PATH sur toutes les plateformes.

Étape 2 : Configuration des variables d’environnement

Les variables d’environnement configurent Claude Code pour utiliser DeepSeek V3.1 via les points de terminaison API de Novita AI. Ces variables indiquent à Claude Code où envoyer les requêtes et comment s’authentifier.

Pour Windows

Ouvrez l’invite de commandes et définissez les variables d’environnement suivantes :

set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL=deepseek/deepseek-v3.1
set ANTHROPIC_SMALL_FAST_MODEL=deepseek/deepseek-v3.1

Remplacez <Novita API Key> par votre clé API réelle obtenue depuis la plateforme Novita AI. Ces variables restent actives pour la session en cours et doivent être redéfinies si vous fermez l’invite de commandes.

Pour Mac et Linux

Ouvrez le terminal et exportez les variables d’environnement suivantes :

export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.1"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.1"

Étape 3 : Démarrage de Claude Code

Une fois l’installation et la configuration terminées, vous pouvez démarrer Claude Code dans votre répertoire de projet. Naviguez vers l’emplacement de votre projet souhaité à l’aide de la commande cd :

cd <your-project-directory>
claude .

Le paramètre point (.) indique à Claude Code d’opérer dans le répertoire courant. Au démarrage, vous verrez l’invite Claude Code apparaître dans une session interactive.

Cela indique que l’outil est prêt à recevoir vos instructions. L’interface offre un environnement propre et intuitif pour les interactions de programmation en langage naturel.

Étape 4 : Construction de votre premier projet

Claude Code excelle dans la transformation de descriptions détaillées de projets en applications fonctionnelles. Après avoir saisi votre invite, appuyez sur Entrée pour commencer la tâche. Claude Code analysera vos besoins, créera les fichiers nécessaires, implémentera la fonctionnalité et fournira une structure de projet complète avec documentation.

Comment accéder à DeepSeek V3.1 : Se connecter avec d’autres plateformes tierces

Outils de développement : Intégration transparente avec les IDE et environnements de développement populaires comme Cursor, Trae, Qwen Code et Cline via des API compatibles OpenAI et Anthropic.

Frameworks d’orchestration : Connectez-vous avec LangChain, Dify, CrewAI, Langflow et d’autres plateformes d’orchestration IA à l’aide de connecteurs officiels.

Intégration Hugging Face : Novita AI sert de fournisseur d’inférence officiel de Hugging Face, garantissant une large compatibilité avec l’écosystème.

FAQ

Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles IA via notre API simple, tout en fournissant un cloud GPU abordable et fiable pour construire et faire évoluer.

Lectures recommandées

DeepSeek-V3.1 Disponible sur Novita AI : Fenêtre de contexte améliorée et mode de réflexion hybride révolutionnaire

DeepSeek R1 7B : 90 % de la puissance de DeepSeek R1 avec 10 fois plus d’efficacité matérielle

DeepSeek V3 0324 Disponible sur Novita AI

Comment accéder à DeepSeek V3.1 : Guide complet

Introduction de base

Benchmarks

Principales améliorations

Comment accéder à DeepSeek V3.1 : Déploiement local

Configuration requise pour DeepSeek V3.1

Comment accéder à DeepSeek V3.1 : Utiliser l’API

Option 1 : Intégration API directe (Exemple Python)

Option 2 : Workflows multi-agents avec OpenAI Agents SDK

Comment accéder à DeepSeek V3.1 : Intégration avec Claude Code

Comment accéder à DeepSeek V3.1 : Se connecter avec d’autres plateformes tierces

FAQ

Lectures recommandées

Product

RESOURCES

Partners

Company

Introduction de base

Benchmarks

Principales améliorations

Comment accéder à DeepSeek V3.1 : Déploiement local

Configuration requise pour DeepSeek V3.1

Comment accéder à DeepSeek V3.1 : Utiliser l’API

Option 1 : Intégration API directe (Exemple Python)

Option 2 : Workflows multi-agents avec OpenAI Agents SDK

Comment accéder à DeepSeek V3.1 : Intégration avec Claude Code

Comment accéder à DeepSeek V3.1 : Se connecter avec d’autres plateformes tierces

FAQ

Lectures recommandées

Articles associés

Product

RESOURCES

Partners

Company