Les développeurs qui gèrent de grandes bases de code ou des flux de travail multi-documents rencontrent des défis persistants : coût de calcul élevé, performances instables en contexte long et compréhension de code incohérente lorsqu’ils utilisent des modèles Transformer classiques. Ces contraintes limitent l’efficacité des itérations, restreignent l’analyse à l’échelle du dépôt et augmentent les dépenses opérationnelles. L’introduction de DeepSeek V3.2 résout ces points de douleur en intégrant l’Attention Éparse DeepSeek (DSA), un mécanisme conçu pour réduire la surcharge d’attention, accélérer le raisonnement contextuel et stabiliser la génération de code.
Cet article examine comment DeepSeek V3.2 améliore l’efficacité des coûts, le traitement du contexte long et les capacités axées sur le code. Il présente des guides opérationnels pour déployer DeepSeek V3.2 via Novita AI et Claude Code.
À votre attention ! Novita AI lance sa campagne « Mois de la Construction », offrant aux développeurs une incitation exclusive allant jusqu’à 20% de réduction sur tous les produits principaux !
Participez au Mois de la Construction !
Quelles sont les nouvelles fonctionnalités de codage de DeepSeek V3.2 ?
Le DSA est un mécanisme d’attention révolutionnaire qui change fondamentalement la façon dont le modèle traite les informations. Alors que les Transformers classiques nécessitent que chaque jeton fasse attention à tous les autres jetons, ce qui entraîne un coût de calcul quadratique (O(n²)), le DSA introduit un mécanisme de sélection granulaire et conscient du contenu :
- Filtrage intelligent : pendant l’entraînement, le modèle apprend à identifier quelles relations entre jetons sont réellement importantes pour des tâches spécifiques
- Connexions dynamiques : sélection en temps réel des connexions d’attention nécessaires en fonction du contenu de l’entrée.
- Optimisation des tâches : se concentre sur différents modèles structurels lors du traitement de code par rapport aux documents juridiques
Trois améliorations clés permises par le DSA
L’auto-adaptation directe est utilisée comme mécanisme auxiliaire pour améliorer les performances globales du modèle sans modifier l’architecture de base. Grâce à cette approche, le modèle atteint une efficacité de coût significative en permettant une inférence plus économique tout en préservant une qualité de génération et d’analyse de code comparable à la v3.1, soutenant ainsi des tests fréquents et des itérations rapides.
Le DSA renforce également l’utilisation du contexte long en exploitant efficacement une fenêtre de contexte allant jusqu’à 128 000 jetons, ce qui améliore l’analyse simultanée de plusieurs fichiers, la compréhension des dépendances entre fichiers et le traitement de documents techniques complexes.
De plus, le DSA contribue à améliorer les capacités liées au code, notamment des réponses d’inférence plus rapides, une compréhension du code plus précise et une qualité de génération de code plus stable, améliorant collectivement la fiabilité et l’efficacité du modèle dans des scénarios de développement logiciel à grande échelle.
Framework d’apprentissage par renforcement évolutif
En adoptant un protocole d’apprentissage par renforcement robuste et en augmentant le calcul post-entraînement, DeepSeek-V3.2 atteint des performances comparables à GPT-5. Notamment, la variante à haut calcul, DeepSeek-V3.2-Speciale, surpasse systématiquement GPT-5 et démontre des capacités de raisonnement équivalentes à Gemini-3.0-Pro.
| Benchmark | Métrique | DeepSeek-V3.2-Speciale | DeepSeek-V3.2-Thinking | GPT-5-High | Claude-4.5-Sonnet | Gemini-3.0-Pro |
|---|---|---|---|---|---|---|
| AIME 2025 | Pass@1 (%) | 96.0 | 93.1 | 94.6 | 87.0 | 95.0 |
| HMMT 2025 | Pass@1 (%) | 99.2 | 90.2 | 88.3 | 79.2 | 97.5 |
| HLE | Pass@1 (%) | 30.6 | 25.1 | 26.3 | 13.7 | 37.7 |
| Codeforces | Rating | 2701 | 2386 | 2537 | 1480 | 2708 |
| SWE Verified | Résolu (%) | – | 73.1 | 74.9 | 77.2 | 76.2 |
| Terminal Bench 2.0 | Précision (%) | – | 46.4 | 35.2 | 42.8 | 54.2 |
| τ² Bench | Pass@1 (%) | – | 80.3 | 80.2 | 84.7 | 85.4 |
| Tool Decathlon | Pass@1 (%) | – | 35.2 | 29.0 | 38.6 | 36.4 |
Essayez DeepSeek V3.2 avec 20% de réduction !
DeepSeek V3.2 : Quelles mesures ont été prises pour mieux collaborer avec les développeurs ?
Pour mieux intégrer le raisonnement dans les scénarios d’utilisation d’outils, DeepSeek a introduit un Pipeline de synthèse de tâches agentiques à grande échelle lors de l’étape post-entraînement de la V3.2. L’idée centrale est de générer systématiquement des données d’entraînement agentiques à grande échelle, plutôt que de s’appuyer sur des prompts artisanaux ou des démonstrations humaines limitées.
Ce pipeline construit programmatiquement des tâches qui nécessitent que le modèle raisonne, décide, appelle des outils, observe des résultats intermédiaires et ajuste son comportement en conséquence. En exposant le modèle à une grande variété d’interactions structurées, DeepSeek permet un post-entraînement agentique évolutif, améliorant significativement à la fois la conformité comportementale et la généralisation dans des environnements interactifs complexes et multi-étapes tels que la recherche, le codage et les flux de travail augmentés par des outils.
Les deux mises à jour les plus importantes sont :
Un format d’appel d’outils révisé, conçu pour être plus explicite et plus stable dans les interactions multi-étapes
Une prise en charge native du « raisonnement avec des outils », où le raisonnement et l’utilisation d’outils sont intégrés structurellement plutôt qu’entrelacés de manière lâche
Pour aider la communauté à comprendre et adopter ce nouveau modèle, DeepSeek fournit un dossier encoding dédié. Ce dossier inclut des scripts Python et des cas de test qui démontrent : comment encoder des messages compatibles OpenAI en une seule chaîne d’entrée attendue par DeepSeek-V3.2 et comment analyser la sortie texte du modèle pour la reconvertir en messages structurés.
import transformers
# encoding/encoding_dsv32.py
from encoding_dsv32 import encode_messages, parse_message_from_completion_text
tokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")
messages = [
{"role": "user", "content": "hello"},
{"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
{"role": "user", "content": "1+1=?"}
]
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)
prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)
Il est à noter que cette version n’inclut pas de modèle de chat basé sur Jinja. L’implémentation Python fournie est la référence faisant autorité. De plus, la fonction d’analyse de sortie suppose des sorties de modèle bien formées et est destinée à la démonstration et à l’expérimentation, et non à une utilisation en production directe sans gestion d’erreurs supplémentaire.
Essayez DeepSeek V3.2 avec 20% de réduction !
Pourquoi le rôle developer est-il nécessaire ?
Dans des scénarios d’agents réels, un modèle a souvent besoin de traiter simultanément trois types d’informations distincts :
- L’intention réelle de l’utilisateur ou l’objectif de la tâche
- Le propre processus de raisonnement et de prise de décision du modèle
- Les stratégies de recherche, les contraintes d’outils et les règles d’exécution fournies par le système ou le développeur
Dans les versions précédentes, ces signaux étaient généralement mélangés dans les prompts utilisateur ou système. Au fil du temps, cela a entraîné deux problèmes majeurs. Premièrement, le modèle pouvait avoir du mal à distinguer l’intention de l’utilisateur des contraintes comportementales obligatoires. Deuxièmement, à mesure que les chaînes d’outils devenaient plus complexes, la stabilité et la fiabilité de l’invocation des outils se dégradaient de manière notable.
Le rôle developer introduit dans DeepSeek-V3.2 sert essentiellement de canal de contrôle dédié pour les agents de recherche et les agents orientés outils. Il est conçu pour transporter des instructions strictement liées au comportement de l’agent, telles que la portée de la recherche, l’ordre d’utilisation des outils ou les contraintes de politique, sans participer à la sémantique conversationnelle ordinaire. Cette séparation explicite permet une compréhension contextuelle plus claire et établit une base structurelle pour un entraînement agentique plus évolutif et robuste.
Comment accéder à DeepSeek V3.2 dans Claude Code ?
Novita AI propose actuellement l’API DeepSeek V3.2 en contexte complet la plus abordable.
Novita AI fournit des API avec un contexte de 65K, et des coûts de 0,269 $ par entrée et 0,4 $ par sortie, prenant en charge les sorties structurées et l’appel de fonctions, ce qui offre un soutien solide pour maximiser le potentiel d’agent de code de DeepSeek V3.2.
Lecture de cache : 0,1345 $ par million de jetons indique le coût de lecture des jetons mis en cache lorsqu’un hit de cache se produit. Ces jetons ont été préalablement calculés et stockés, donc aucune inférence de modèle supplémentaire n’est nécessaire. Dans les systèmes où de nombreuses requêtes partagent le même préfixe de prompt, réutilisent l’historique de conversation, les instructions d’outils ou des textes de règles fixes, ou où les résultats de récupération RAG sont très répétitifs, un taux de hit de cache élevé peut être atteint, réduisant significativement le coût global d’inférence.
Étape 1 : Obtenir votre clé API
Étape 1 : Connectez-vous à votre compte et cliquez sur le bouton Bibliothèque de modèles.

Étape 2 : Choisissez votre modèle
Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Étape 3 : Démarrez votre essai gratuit
Commencez votre essai gratuit pour explorer les capacités du modèle sélectionné.

Étape 4 : Obtenez votre clé API
Pour vous authentifier auprès de l’API, nous vous fournirons une nouvelle clé API. En accédant à la page « Paramètres », vous pouvez copier la clé API comme indiqué sur l’image.

Étape 5 : Installez l’API
Installez l’API à l’aide du gestionnaire de paquets spécifique à votre langage de programmation.
Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec le LLM Novita AI. Voici un exemple d’utilisation de l’API de complétion de chat pour les utilisateurs Python.
from openai import OpenAI
client = OpenAI(
api_key="<Votre clé API>",
base_url="https://api.novita.ai/openai"
)
response = client.chat.completions.create(
model="deepseek/deepseek-v3.2",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello, how are you?"}
],
max_tokens=65536,
temperature=0.7
)
print(response.choices[0].message.content)
Utiliser DeepSeek V3.2 avec Claude Code
Étape 1 : Installer Claude Code
Avant d’installer Claude Code, assurez-vous que votre système répond aux exigences minimales. Node.js 18 ou une version supérieure doit être installé sur votre environnement local. Vous pouvez vérifier votre version de Node.js en exécutant node --version dans votre terminal.
Pour Windows
Ouvrez l’Invite de commandes et exécutez les commandes suivantes :
npm install -g @anthropic-ai/claude-code
npx win-claude-code@latest
L’installation globale garantit que Claude Code est accessible depuis n’importe quel répertoire de votre système. La commande npx win-claude-code@latest télécharge et exécute la dernière version spécifique à Windows.
Pour Mac et Linux
Ouvrez le Terminal et exécutez :
npm install -g @anthropic-ai/claude-code
Les utilisateurs Mac peuvent procéder directement à l’installation globale sans avoir besoin de commandes supplémentaires spécifiques à la plateforme. Le processus d’installation configure automatiquement les dépendances et les variables PATH nécessaires.
Étape 2 : Configurer les variables d’environnement
Les variables d’environnement configurent Claude Code pour utiliser DeepSeek v3.2 via les points de terminaison de l’API Novita AI. Ces variables indiquent à Claude Code où envoyer les requêtes et comment s’authentifier.
Pour Windows
Ouvrez l’Invite de commandes et définissez les variables d’environnement suivantes :
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Clé API Novita>
set ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
set ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"
Remplacez <Clé API Novita> par votre clé API réelle obtenue sur la plateforme Novita AI. Ces variables restent actives pour la session en cours et doivent être réinitialisées si vous fermez l’Invite de commandes.
Pour Mac et Linux
Ouvrez le Terminal et exportez les variables d’environnement suivantes :
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Clé API Novita>"
export ANTHROPIC_MODEL="deepseek/deepseek-v3.2"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek/deepseek-v3.2"
Étape 3 : Démarrer Claude Code
Une fois l’installation et la configuration terminées, vous pouvez maintenant démarrer Claude Code dans le répertoire de votre projet. Accédez à l’emplacement de votre projet souhaité à l’aide de la commande cd :
cd <répertoire-de-votre-projet>
claude .
Le paramètre point (.) indique à Claude Code de fonctionner dans le répertoire actuel. Au démarrage, vous verrez l’invite de Claude Code apparaître dans une session interactive.
Cela indique que l’outil est prêt à recevoir vos instructions. L’interface fournit un environnement propre et intuitif pour les interactions de programmation en langage naturel.
Étape 4 : Utiliser Claude Code dans VSCode ou Cursor
Claude Code s’intègre parfaitement aux environnements de développement populaires. Il améliore votre flux de travail existant plutôt que de le remplacer.
Vous pouvez utiliser Claude Code directement dans le terminal de VSCode ou Cursor. Cela vous permet de conserver l’accès à vos outils de développement familiers tout en bénéficiant de l’assistance IA.
De plus, des plugins Claude Code sont disponibles pour VSCode et Cursor.
Comment utiliser des modèles externes dans Claude Code ?
Si vous souhaitez basculer dynamiquement entre différents grands modèles de langage (par exemple Claude d’Anthropic, GLM de Zhipu et Kimi de Moonshot) dans votre flux de travail de développement, il existe des stratégies pour le faire sans modifications de code importantes. Cette section explique comment échanger rapidement de modèles à l’aide d’API unifiées et de bascules de configuration.
Utilisation des variables d’environnement (approche Claude Code) :
Si vous travaillez avec des outils comme Claude Code ou un SDK lié à une API spécifique, vous pouvez changer de modèle simplement en ajustant votre configuration d’environnement. Novita AI propose plusieurs options de modèles que vous pouvez tester pour trouver celui qui correspond le mieux à vos besoins.

Découvrez les autres modèles maintenant !
DeepSeek V3.2 introduit le DSA comme une mise à niveau architecturale ciblée qui réduit considérablement le coût de calcul, augmente l’efficacité du contexte long et améliore la précision axée sur le code tout en maintenant des performances de raisonnement compétitives. Le modèle permet une analyse évolutive de grands dépôts et de documents techniques complexes, démontrant un équilibre favorable entre efficacité et capacité par rapport à DeepSeek V3.1-Terminus et aux alternatives propriétaires. Ces avancées établissent DeepSeek V3.2 comme une solution rentable pour des flux de travail de développement durables et des applications IA en contexte long.
Foire aux questions
Quel est l’avantage principal de l’Attention Éparse DeepSeek (DSA) dans DeepSeek V3.2 ?
DeepSeek V3.2 utilise le DSA pour activer sélectivement les connexions d’attention, réduisant le coût quadratique de l’attention tout en préservant une compréhension précise du code sur des contextes longs.
En quoi DeepSeek V3.2 diffère-t-il de DeepSeek V3.1-Terminus dans les flux de travail de codage pratiques ?
DeepSeek V3.2 offre un coût opérationnel plus faible, une fenêtre de contexte de 128K et une stabilité d’inférence plus rapide par rapport à DeepSeek V3.1-Terminus, ce qui permet une analyse de code à l’échelle du dépôt plus efficace.
Est-ce que DeepSeek V3.2 améliore le traitement des documents techniques en contexte long ?
Oui. DeepSeek V3.2 prend en charge l’analyse simultanée de documents complexes et de relations entre fichiers, surpassant DeepSeek V3.1-Terminus dans les tâches de raisonnement multi-documents.
Novita AI est la plateforme cloud tout-en-un qui donne vie à vos ambitions IA. API intégrées, serverless, instances GPU — les outils rentables dont vous avez besoin. Éliminez les infrastructures, commencez gratuitement et concrétisez votre vision IA.
Lectures recommandées
Comment accéder à Qwen 3 Coder : Qwen Code, Claude Code, Trae
DeepSeek vs Qwen : Identifiez quel écosystème correspond aux besoins de production

