Novita AI permet d’exécuter facilement des modèles open source de pointe avec une inférence GPU prête pour la production, sans avoir à gérer des clusters, des pilotes ou des problèmes de mise à l’échelle. Dans ce guide, nous allons vous montrer comment utiliser Qwen3.5-397B-A17B au sein de Claude Code en acheminant les requêtes via l’API de Novita AI, afin que vous puissiez conserver votre flux de travail de développeur habituel tout en intégrant un puissant modèle Qwen pour le codage, la refactorisation et les tâches nécessitant un long contexte. Si vous souhaitez un meilleur contrôle des coûts, un choix de modèle flexible et une configuration « drop-in » simple, ce tutoriel est fait pour vous.
Essayez Qwen3.5-397B-A17B dès maintenant !
Qu’est-ce que Qwen3.5-397B-A17B ?
Qwen3.5-397B-A17B est le modèle phare nativement multimodal (texte + image + vidéo en entrée, texte en sortie) de la famille Qwen3.5 d’Alibaba. Sur le plan architectural, il s’agit d’un modèle Hybride de Mélange d’Experts (MoE) comptant 397 milliards de paramètres au total mais seulement ~17 milliards activés par jeton, ce qui est l’une des principales raisons pour lesquelles il offre des capacités de « niveau pointe » avec une efficacité d’inférence bien meilleure que les modèles denses de taille totale similaire.
Caractéristiques clés importantes pour les développeurs :
- Longueur de contexte : 262 144 jetons
- Entrée multimodale : prend en charge le texte, les images et les vidéos (idéal pour les flux de travail d’agents nécessitant des captures d’écran d’interface, des journaux, des diagrammes ou des images de vidéo).
- Forte orientation agent et codage : les points forts de Qwen3.5 mettent l’accent sur le raisonnement, le codage et les capacités d’agent comme objectifs prioritaires.
Si vous l’évaluez à l’aide de benchmarks indépendants et de comparaisons entre fournisseurs, Artificial Analysis suit la qualité, la vitesse et le prix auprès de différents fournisseurs pour le Qwen3.5 397B A17B.
Pourquoi utiliser Qwen3.5-397B-A17B avec Claude Code ?
Claude Code est un outil de codage agentique qui s’exécute dans votre terminal (et vos IDE), lit votre base de code, modifie des fichiers, exécute des commandes et vous aide avec vos flux de travail git. La documentation d’Anthropic indique explicitement que l’interface CLI du terminal et VS Code prennent en charge les fournisseurs tiers, ce qui permet d’acheminer les requêtes de Claude Code vers des modèles non-Anthropic via des points d’accès compatibles.
Associer Qwen3.5-397B-A17B et Claude Code est particulièrement intéressant si vous souhaitez :
- Codage avec long contexte et refactorisations sans perdre la structure globale : grâce à son contexte natif de 262K jetons, Qwen3.5 peut conserver une plus grande partie de votre dépôt, de vos journaux, de vos traces de pile et de vos spécifications « en mémoire » lors de tâches multi-étapes, ce qui est pratique pour les migrations, les refactorisations de monorepo ou le débogage d’incidents complexes.
- Flux de travail d’agents incluant des captures d’écran et des éléments d’interface : comme Qwen3.5 est nativement multimodal, vous pouvez fournir des captures d’écran d’interface (ou des diagrammes générés) au même modèle qui écrit et modifie du code, ce qui est utile pour des boucles de type « corriger ce bug de mise en page » ou « recréer ce composant d’interface ».
- Expérimentation à grande échelle à moindre coût (sans modifier votre flux de travail) : en utilisant l’API serverless de Novita AI, vous pouvez appeler
qwen/qwen3.5-397b-a17ben paiement par jeton et conserver vos habitudes Claude Code existantes (commandes slash, analyse du dépôt, modifications itératives).
Comment utiliser Qwen3.5-397B-A17B dans Claude Code
Avant de commencer : l’API Qwen3.5 de Novita AI (fonctionnalités et tarification)
Novita propose Qwen3.5-397B-A17B sous la forme d’une API serverless : vous pouvez envoyer des requêtes immédiatement et ne payer que pour l’utilisation.
Sur la page du modèle, vous pouvez également vérifier ce que vous obtiendrez dès la sortie de l’emballage :
- Longueur de contexte : 262 144
- Sortie maximale : 64 000
- Appel de fonctions : Pris en charge
- Sortie structurée : Pris en charge
- Entrée : texte, image, vidéo (Sortie : texte)
Et la tarification (serverless) :
- Entrée : 0,6 $ par million de jetons
- Sortie : 3,6 $ par million de jetons
En savoir plus sur l’API Novita !
Étape 1 : Obtenir votre clé API sur Novita AI
- Créez un compte ou connectez-vous : rendez-vous sur https://novita.ai et inscrivez-vous ou connectez-vous.
- Accédez à la gestion des clés : après vous être connecté, trouvez « Clés API » dans la console/les paramètres.
- Créez une nouvelle clé : cliquez sur « Ajouter une nouvelle clé ».
- Enregistrez votre clé immédiatement : copiez et stockez la clé dès qu’elle est générée (utilisez un gestionnaire de mots de passe / des notes chiffrées).

Étape 2 : Installer Claude Code
Claude Code recommande désormais des installateurs natifs :
- macOS, Linux, WSL :
curl -fsSL https://claude.ai/install.sh | bash
- Windows PowerShell :
irm https://claude.ai/install.ps1 | iex
- Windows CMD :
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd
Remarque : Sous Windows, Claude Code nécessite Git for Windows (installez-le d’abord si vous ne l’avez pas déjà).
Vérifiez votre installation
claude --version
Étape 3 : Configurer les variables d’environnement
- Sous Windows (CMD)
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Your_Novita_API_Key>
set ANTHROPIC_MODEL=qwen/qwen3.5-397b-a17b
set ANTHROPIC_SMALL_FAST_MODEL=qwen/qwen3.5-397b-a17b
- Sous macOS et Linux
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Your_Novita_API_Key>"
export ANTHROPIC_MODEL="qwen/qwen3.5-397b-a17b"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3.5-397b-a17b"
Étape 4 : Lancer Claude Code
- Accédez au répertoire de votre projet
cd <path_to_your_project>
- Lancez Claude Code
claude .
Le point (.) indique à Claude Code d’opérer sur le répertoire actuel, en analysant et en travaillant dans ce projet. Vous obtiendrez une invite interactive où vous pourrez utiliser des commandes comme /init, /model, /review, etc. (Consultez la présentation officielle pour savoir comment Claude Code opère sur les fichiers et les outils.)
Une seule configuration, plusieurs modèles
Si vous souhaitez passer d’un grand modèle de langage à un autre dans votre flux de travail de développement (par exemple, passer d’un modèle de « brouillon rapide » à un modèle de « raisonnement approfondi »), vous pouvez le faire sans modifier votre base de code.
Novita AI rend cela particulièrement simple en proposant des API unifiées et axées sur la compatibilité : vous pouvez tester rapidement plusieurs modèles et conserver la stabilité de votre flux de travail.
Utiliser les variables d’environnement
Si vous travaillez avec Claude Code (ou tout outil lié au SDK Anthropic), vous pouvez changer de modèle en mettant à jour les variables d’environnement, aucune refactorisation n’est nécessaire.
Sous macOS/Linux :
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Your_Novita_API_Key>"
export ANTHROPIC_MODEL="qwen/qwen3-coder-next" # ← swap model here
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3-coder-next"
Sous Windows (CMD) :
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Your_Novita_API_Key>
set ANTHROPIC_MODEL=qwen/qwen3-coder-next # ← swap model here
set ANTHROPIC_SMALL_FAST_MODEL=qwen/qwen3-coder-next
Pour changer de modèle, il suffit de remplacer la valeur de ANTHROPIC_MODEL par un autre nom de modèle pris en charge (par ex. deepseek/deepseek-v3.2, zai-org/glm-4.7, moonshotai/kimi-k2.5, etc.).
Consultez les autres modèles dès maintenant !

Conclusion
Qwen3.5-397B-A17B allie l’efficacité MoE (397 milliards au total / 17 milliards actifs), un contexte natif de 262K jetons et des entrées nativement multimodales : une combinaison idéale pour les charges de travail de « codage agentique » modernes.
En acheminant Claude Code via le point d’accès compatible Anthropic de Novita AI, vous pouvez conserver le même flux de travail natif du terminal (planifier → modifier → exécuter → itérer) tout en bénéficiant des atouts de Qwen3.5 en matière de long contexte et de multimodalité, souvent avec un contrôle des coûts plus flexible grâce à l’accès serverless et au paiement par jeton de Novita.
Novita AI est la plateforme cloud tout-en-un qui donne vie à vos ambitions en matière d’IA. API intégrées, serverless, instances GPU : les outils rentables dont vous avez besoin. Éliminez les problèmes d’infrastructure, commencez gratuitement et concrétisez votre vision de l’IA.
Questions fréquemment posées
Qu’est-ce que Qwen3.5-397B-A17B ?
Qwen3.5-397B-A17B est un grand modèle de langage de la famille Qwen, conçu pour des tâches de raisonnement et de codage de haute qualité. Il est capable de traiter des instructions complexes et de générer du contenu long, ce qui en fait une option solide pour les flux de travail de développement logiciel.
Qu’est-ce que Claude Code ?
Claude Code est un outil pour développeurs (d’Anthropic) qui vous permet d’utiliser un LLM pour vous aider dans vos tâches de codage directement dans votre flux de travail : comprendre une base de code, générer des correctifs, refactoriser, écrire des tests et expliquer du code, le plus souvent via une expérience de type CLI.
Comment utiliser Qwen3.5-397B-A17B dans Claude Code avec Novita AI ?
Vous pouvez orienter Claude Code vers l’API compatible Anthropic de Novita AI en définissant votre point d’accès et votre clé API dans les variables d’environnement, puis en sélectionnant Qwen3.5-397B-A17B comme modèle. Cela vous permet d’exécuter Qwen au sein de Claude Code sans modifier le code de votre projet : il suffit de changer la configuration.
