Qwen3-Coder-Next est conçu pour le codage agentique : des tâches logicielles multi-étapes où le modèle doit planifier, appeler des outils, récupérer après des échecs et maintenir le contexte sur des workflows longs.
Sur Novita AI, vous pouvez exécuter Qwen3-Coder-Next via une API compatible OpenAI, obtenant ainsi des performances solides pour les agents de codage sans avoir à déployer ou gérer votre propre infrastructure GPU.
Qu’est-ce que Qwen3-Coder-Next ?
Aperçu du modèle
| Élément | Détails |
| Organisation | Qwen Team (Alibaba) |
| Date de publication | 4 févr. 2026 |
| Paramètres | 80B totaux / ~3B activés (MoE) |
| Architecture | Hybrid Attention + MoE haute sparsité (Disposition hybride avec Gated DeltaNet + Gated Attention) |
| Fenêtre de contexte | 262 144 tokens (256K) natifs, extensibles |
Qwen3-Coder-Next est un modèle de codage agentique à poids ouverts optimisé pour obtenir des résultats solides sur des benchmarks réels tout en maintenant des coûts d’inférence bas. Sa conception MoE limite le nombre de paramètres actifs au moment de l’exécution, et l’attention hybride permet un raisonnement sur de longs contextes. Le modèle est conçu pour s’intégrer directement dans des workflows de codage pratiques : outils CLI, agents IDE et appels d’outils structurés, tout en restant suffisamment rapide pour le développement quotidien.
Benchmarks et performances
Résultats de benchmark

Points clés pratiques
- Solides performances sur SWE-Bench Verified : un score de 70,6 % indique que le modèle peut gérer la correction de bugs au niveau de dépôts réels, incluant la recherche, l’application de correctifs et les boucles de test — un signal important pour les agents de codage de qualité production.
- Support multilingue compétitif des dépôts : le score de 62,8 % sur SWE-Bench Multilingual suggère que le modèle n’est pas strictement anglophone, ce qui le rend adapté aux équipes internationales avec des problèmes, commentaires et documentations multilingues.
- Résultats solides sur SWE-Bench Pro : un score de 44,3 % sur le sous-ensemble Pro plus difficile reflète un raisonnement à long horizon plus fort, en particulier dans les scénarios de débogage multi-étapes et de récupération après erreur.
- Pertinence de TerminalBench pour l’utilisation d’outils : TerminalBench 2.0 évalue des boucles structurées de commandes/sorties, qui correspondent étroitement à l’automatisation DevOps, au débogage CI et aux agents pilotés par shell.
- Le score Aider témoigne du codage interactif : un score Aider de 66,2 % est un bon indicateur pour les workflows de programmation en binôme tels que les modifications itératives, les refactorisations et le développement incrémental de fonctionnalités.
Vitesse et latence
L’expérience développeur dépend fortement de la latence, pas seulement de la précision brute :

Pourquoi c’est important sur Novita AI
Qwen3-Coder-Next est conçu pour être efficace : avec 80B de paramètres totaux mais seulement ~3B actifs lors de l’inférence, il est particulièrement rentable pour les charges de travail de codage agentique. Sur Novita AI, cette efficacité se traduit directement par des tarifs prévisibles et compétitifs :
- Entrée : 0,2 $ par million de tokens
- Sortie : 1,5 $ par million de tokens
Combiné à l’API évolutive de Novita AI, vous pouvez déployer des agents de codage haute performance qui gèrent le raisonnement sur longs contextes et les workflows multi-étapes — sans avoir à gérer de GPU ni à supporter des coûts d’infrastructure imprévisibles.
Comment accéder à Qwen 3 sur Novita AI
Démarrage rapide : Playground
Pour une évaluation rapide, commencez par le Playground de Novita pour expérimenter avec des prompts, comparer des modèles et valider la qualité des sorties avant intégration.

Utiliser Qwen3-Coder-Next via API
Comment obtenir des clés API
- Étape 1 : Créer un compte ou se connecter : Rendez-vous sur
[https://novita.ai](https://novita.ai)et inscrivez-vous ou connectez-vous. - Étape 2 : Accéder à la gestion des clés : Après connexion, recherchez « Clés API ».
- Étape 3 : Créer une nouvelle clé : Cliquez sur le bouton « Ajouter une nouvelle clé ».
- Étape 4 : Sauvegardez votre clé immédiatement : Copiez et stockez la clé dès qu’elle est générée ; elle n’est affichée qu’une seule fois.

Utilisez les exemples de code suivants pour intégrer notre API :
Python (Exemple)
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["NOVITA_API_KEY"],
base_url="https://api.novita.ai/v3/openai",
)
resp = client.chat.completions.create(
model="Qwen/Qwen3-Coder-Next",
messages=[
{"role": "system", "content": "You are a senior software engineer."},
{"role": "user", "content": "Fix the bug and write tests. Here is the stack trace: ..."}
],
temperature=0.2,
)
print(resp.choices[0].message.content)
SDK
Si vous développez des agents, Novita s’intègre parfaitement avec les frameworks qui attendent des complétions de chat OpenAI :
- Compatibilité avec le SDK OpenAI Agents
- Les SDK Python/Node standards d’OpenAI fonctionnent avec des modifications minimales grâce à la compatibilité API
Plateformes tierces
Les modèles hébergés par Novita peuvent également être utilisés dans de nombreux écosystèmes populaires — vous pouvez donc intégrer Qwen3-Coder-Next dans vos outils existants sans modifier votre workflow :
- Frameworks d’agents et outils de création d’apps : Guides d’intégration pour Continue, AnythingLLM, LangChain et Langflow.
- Hub Hugging Face : Novita est répertorié comme Fournisseur d’inférence, permettant d’exécuter les modèles pris en charge via l’écosystème de fournisseurs de Hugging Face.
- Outils compatibles OpenAI : Novita suit le standard d’API OpenAI, vous pouvez donc connecter des applications et outils de style OpenAI tels que Cline, Cursor, Trae et Qwen Code avec des modifications minimales.
- Accès compatible Anthropic : Novita prend également en charge l’intégration compatible SDK Anthropic pour les workflows de style Claude Code.
- OpenCode et observabilité : Utilisez Novita directement dans OpenCode.
Conclusion
Qwen3-Coder-Next occupe un point idéal pratique : force de codage agentique, raisonnement sur longs contextes et haut débit, propulsé par une conception MoE qui maintient les coûts d’exécution sous contrôle. Pour les équipes souhaitant déployer des agents de codage — ou simplement accélérer leurs workflows de développement — exécuter Qwen3-Coder-Next sur Novita AI via son API compatible OpenAI est l’un des chemins les plus simples pour passer de l’évaluation à la production.
Novita AI est une plateforme cloud IA qui offre aux développeurs un moyen simple de déployer des modèles IA via notre API simple, tout en fournissant un cloud GPU abordable et fiable pour la construction et la mise à l’échelle.
Foire aux questions
Qu’est-ce que Qwen3-Coder-Next ?
Qwen3-Coder-Next est un modèle de codage à poids ouverts de l’équipe Qwen, conçu pour le codage agentique (tâches de codage multi-étapes avec utilisation d’outils, retour d’exécution et récupération après erreur). Il est basé sur Qwen3-Next-80B-A3B-Base et utilise une architecture d’attention hybride + MoE pour obtenir des performances solides en codage et en agentique avec un coût d’inférence plus faible.
Combien coûte Qwen3 Coder ?
Sur Novita AI, Qwen3-Coder-Next est tarifé à 0,20 $ par million de tokens d’entrée et 1,50 $ par million de tokens de sortie (sans serveur)
Quels fournisseurs d’API proposent Qwen3-Coder-Next ?
Qwen3-Coder-Next est disponible auprès de plusieurs fournisseurs d’API, avec Novita AI comme option rentable et compatible OpenAI. Les autres fournisseurs incluent Chutes, Parasail et Together AI, qui diffèrent par la latence, le débit et les tarifs.
