Utiliser GPT‑OSS dans TRAE : débloquer le format Harmony pour le codage IA

Table des matières

Qu'est‑ce que Trae ?
Qu'est‑ce que GPT OSS ?
Pourquoi choisir GPT OSS pour le codage IA ?
Comment utiliser GPT OSS dans Trae ?
Limitation de GPT OSS

Le développement logiciel piloté par l’IA avance rapidement, porté par deux grandes tendances : les modèles open-source puissants et les environnements de développement IA entièrement intégrés. GPT‑OSS est la série de modèles à poids ouverts d’OpenAI, réputée pour son raisonnement solide, ses capacités de type agent et sa personnalisation approfondie. TRAE, de ByteDance, est un IDE IA conçu pour agir comme un « Ingénieur IA » complet capable de construire des logiciels de manière autonome.

La question est : que se passe‑t‑il lorsque vous combinez la puissance de raisonnement contrôlable de GPT‑OSS avec le cadre de développement automatisé et riche en outils de TRAE ? Ensemble, ils créent un flux de travail à la fois automatisé et adapté à vos besoins précis. Ce guide explique comment les connecter et exploiter tout leur potentiel.

Qu’est‑ce que Trae ?

TRAE est également le nom d’un environnement de développement intégré (IDE) alimenté par l’IA, créé par ByteDance. Il est conçu pour fonctionner comme un « Ingénieur IA » capable de construire indépendamment des solutions logicielles en comprenant des tâches complexes et en les exécutant. TRAE vise à rationaliser le flux de développement en permettant aux utilisateurs de déléguer des tâches à l’IA.

Fonctions clés de Trae

Intégration d’outils améliorée et capacités (Model Context Protocol - MCP)

Intégration d’outils externes : TRAE s’intègre à divers outils externes, permettant aux agents IA de les utiliser pour une exécution plus efficace des tâches.
Support MCP : Il prend en charge le Model Context Protocol (MCP), un standard ouvert pour connecter les applications IA à des sources de données et outils externes. Cela agit comme un port « USB‑C » universel pour l’IA, résolvant le défi de la connexion des modèles IA à des données cloisonnées.
Capacités IA étendues : Grâce à MCP, les agents peuvent accéder à des ressources externes comme Google Drive, Slack, GitHub et des bases de données pour mieux comprendre et accomplir des tâches complexes.

Compréhension contextuelle approfondie et contrôle précis

Compréhension approfondie du contexte de développement : TRAE comprend profondément votre contexte de développement, y compris les dépôts de code, les résultats de recherche en ligne et les documents partagés.
Personnalisation précise du comportement : Vous pouvez personnaliser des règles pour adapter le comportement de l’IA à votre flux de travail, garantissant qu’elle exécute les tâches exactement comme vous le souhaitez.
Interaction multimodale : Prend en charge le téléchargement d’images (par exemple, maquettes de conception, captures d’écran d’erreurs) pour aider à décrire les exigences, permettant à l’IA de générer un code plus précis.

CUE : Prédiction intelligente et édition en un clic

Prédit votre prochaine modification : La fonction CUE (Context Understanding Engine) comprend votre intention et prédit votre prochaine action en analysant votre comportement d’édition.
Navigation et application en un clic : Il suffit d’appuyer sur la touche Tab pour passer à la modification suggérée suivante ou appliquer des suggestions intelligentes sur plusieurs lignes à la fois.
Optimisation continue : La fonction est continuellement optimisée pour de meilleures performances et réactivité, offrant une expérience plus fluide pour la modification, la génération de code et la correction de bugs.

Fonctionnalités IDE complètes et assistance IA

Double mode de développement : Propose un mode IDE pour un flux de travail traditionnel contrôlé par l’utilisateur, et un mode SOLO où l’IA dirige le développement des exigences à la livraison pour une automatisation complète.
IDE complet : Fournit des fonctionnalités IDE standard comme l’édition de code, la gestion de projet et le contrôle de version.
Assistance à la programmation IA : Dispose de diverses assistances alimentées par l’IA, y compris la complétion intelligente de code, le refactoring, les questions‑réponses par chat et la génération de projets à partir de langage naturel.
Aperçu Web intégré : Prend en charge l’aperçu direct des pages Web dans l’IDE pour faciliter le développement et le débogage front‑end.

Qu’est‑ce que Trae Solo ?

Espace de travail unifié et centre d’outils IA :
Le mode SOLO intègre tous les outils de développement nécessaires — l’IDE, le navigateur, le terminal et les documents — directement dans l’IA. Cela permet à l’IA de raisonner et d’agir avec précision en fonction des besoins spécifiques de chaque tâche, comblant ainsi le fossé entre l’idée et l’exécution.
Développement de bout en bout piloté par l’IA :
Vous fournissez simplement les exigences, et SOLO gère de manière autonome l’ensemble du cycle de vie du développement, notamment :
- Analyse des besoins
- Prototypage
- Développement front‑end
- Développement back‑end
- Débogage et optimisation
- Construction et déploiement
Vue de suivi unifiée :
Les utilisateurs peuvent discuter avec l’IA et surveiller toutes les activités de développement depuis une vue unique et unifiée. La « Vue étendue » offre un aperçu détaillé de tous les détails d’exécution en temps réel.
Interaction multimodale : « Parlez » vos exigences :
Le mode SOLO prend en charge la saisie vocale, vous permettant d’interagir avec TRAE aussi naturellement qu’avec un coéquipier humain. La sortie de l’IA ne se limite pas au code ; une vue dynamique extensible sur la droite fournit un retour visuel et intuitif.
L’ingénieur de contexte :
Le mode SOLO est conçu pour être l’ultime « Ingénieur de contexte », capable de comprendre la portée complète de votre travail pour garantir que ses actions et sorties sont basées sur les informations les plus complètes et précises disponibles.

En résumé, l’objectif du mode SOLO de TRAE est de permettre une « IA qui livre des logiciels complets ». Il permet aux développeurs de construire et de publier des logiciels réels plus rapidement grâce à un simple processus « Parler. Réfléchir. Livrer. »

Qu’est‑ce que GPT OSS ?

GPT-OSS (Open-Source Series) est une famille de puissants modèles de langage à poids ouverts publiée par OpenAI, conçue pour être librement disponible à des fins commerciales et exécutable localement sur du matériel grand public. La série comprend deux modèles principaux, une version à 20 milliards et une à 120 milliards de paramètres, optimisés pour un raisonnement solide, l’utilisation d’outils et l’efficacité, marquant un changement significatif d’OpenAI vers une plus grande transparence dans la communauté IA. Ces modèles permettent aux développeurs et chercheurs de les affiner à des fins personnalisées avec un contrôle total sur leurs données et infrastructures, comblant ainsi le fossé entre les systèmes fermés propriétaires et l’IA open-source.


Modèle	Couches	Paramètres totaux	Paramètres actifs par jeton	Experts totaux	Experts actifs par jeton	Longueur de contexte	VRAM GPU unique requise
gpt-oss-120b	36	117B	5,1B	128	4	128k	80 Go
gpt-oss-20b	24	21B	3,6B	32	4	128k	16 Go

Pourquoi choisir GPT OSS pour le codage IA ?

Personnaliser le format : Harmony

Les modèles GPT‑OSS utilisent un format de conversation spécial appelé Harmony. Ce format organise les messages en rôles clairs — system, user et assistant — et vous permet de contrôler la façon dont le modèle réfléchit et répond. Avec Harmony, vous pouvez ajuster la profondeur de raisonnement (faible, moyenne, élevée), décider d’afficher ou de masquer le processus de réflexion, et faire en sorte que le modèle appelle des fonctions de manière stable et structurée. De nombreux autres modèles open‑source n’ont pas ces contrôles intégrés, mais GPT‑OSS les comprend nativement car il a été entraîné à suivre les instructions Harmony. Cela facilite l’obtention de sorties cohérentes, fiables et adaptées aux outils.

Ce que Harmony peut contrôler

Le format Harmony vous permet d’ajuster plusieurs paramètres de comportement clés pour les modèles GPT‑OSS :

Paramètre	Description	Exemple
Profondeur de raisonnement	Contrôle la quantité de réflexion étape par étape effectuée par le modèle.	`"Reasoning: low"`, `"Reasoning: medium"`, `"Reasoning: high"`
Appel de fonction	Prise en charge native de la sortie JSON `function_call` / `tool_calls` de style OpenAI.	`"Always call function weather_api when asked about weather"`
Visibilité du raisonnement	Afficher ou masquer la chaîne de pensée complète dans les balises `thinking` .	`"Show reasoning"` / `"Hide reasoning"`
Règles de format de sortie	Forcer une sortie structurée comme JSON, Markdown, etc.	`"Output in JSON format"`

Exemple de requête Harmony

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Expliquez comment fonctionne le tri rapide."
    }
  ]
}

Avantages lors de l’utilisation de Harmony avec des outils comme Trae

Lorsqu’il est intégré à des plateformes de génération de code, de débogage et d’exécution comme Trae, le format Harmony offre plusieurs avantages pratiques :

Sortie structurée stable
- Harmony garantit que la sortie du modèle suit un format JSON ou bloc de code prévisible.
- Trae peut l’analyser directement sans expressions régulières fragiles ni post‑traitement.
Contrôle de la profondeur de raisonnement
- Utilisez un raisonnement faible pour un prototypage rapide ou du code simple.
- Utilisez un raisonnement élevé pour des algorithmes complexes où l’exactitude est primordiale.
- Économise les ressources GPU/CPU en adaptant le coût de raisonnement à la complexité de la tâche.
Activer/désactiver la visibilité du raisonnement
- Affichez le raisonnement thinking pour le débogage et l’apprentissage.
- Masquez le raisonnement en production pour réduire les jetons et éviter de divulguer la logique interne.
Gestion claire du contexte multi‑tour
- Les règles system persistent entre les tours, garantissant un style de code et des règles d’exécution cohérents.
- Facile à itérer : modifiez les instructions utilisateur sans perdre les paramètres globaux.
Intégration API transparente
- Harmony imite l’API OpenAI Responses, de sorte que toute chaîne d’outils ou plugin IDE compatible avec OpenAI peut fonctionner avec GPT‑OSS avec des modifications minimales.

Utilisation d’outils GPT OSS

Les modèles GPT‑OSS sont entraînés à utiliser nativement des outils externes dans le cadre de leur processus de raisonnement, avec un support intégré pour la navigation, l’exécution Python et l’application de correctifs. Ces outils sont activés en les définissant dans le message system d’une invite au format Harmony.

1. Outil de navigation (Browser)

Objectif : Rechercher sur le Web, ouvrir des pages et trouver du texte sur des pages.
Méthodes :
- search — rechercher des expressions clés.
- open — ouvrir une page spécifique.
- find — localiser du contenu sur une page.
Fonctionnalités :
- Fenêtre de texte défilable pour gérer la taille du contexte.
- Mise en cache pour des visites plus rapides de la même page.
- Entraîné à citer les sources dans les réponses.
Utilisation : Ajoutez la définition de l’outil de navigation via .with_browser() ou .with_tools() dans l’invite system.
Remarque : L’implémentation de référence est à des fins éducatives uniquement — utilisez votre propre backend en production.

2. Outil Python

Objectif : Effectuer des calculs ou exécuter de petits programmes dans le cadre de la chaîne de pensée.
Fonctionnalités :
- Entraîné avec un outil Python avec état pour un raisonnement multi‑étapes.
- L’implémentation de référence utilise un mode sans état.
- Peut remplacer les descriptions d’outils par défaut dans openai‑harmony.
Utilisation : Ajoutez via .with_python() ou .with_tools() dans l’invite system.
Avertissement de sécurité : Le code de référence s’exécute dans un conteneur Docker permissif — ajoutez vos propres restrictions en production.

3. Outil d’application de correctif (Apply Patch)

Objectif : Créer, mettre à jour ou supprimer des fichiers locaux.
Cas d’utilisation : Modifier du code ou des fichiers de projet dans le cadre d’une boucle de développement automatisée.

Comment utiliser GPT OSS dans Trae ?

Prérequis : Obtenir une clé API

Novita AI fournit les API GPT-OSS 120B
avec un contexte de 131K et des coûts de 0,10 $/entrée et 0,50 $/sortie. Novita AI fournit également GPT-OSS 20B avec un contexte de 131 et des coûts de 0,05 $/entrée et 0,20 $/sortie , offrant un support solide pour maximiser le potentiel d’agent de code de GPT OSS.

Novita AI

Étape 1 : Connectez‑vous et accédez à la bibliothèque de modèles

Connectez‑vous à votre compte et cliquez sur le bouton Model Library.

Essayez GPT OSS maintenant !

Étape 2 : Choisissez votre modèle

Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Étape 3 : Démarrez votre essai gratuit

Commencez votre essai gratuit pour explorer les capacités du modèle sélectionné.

Étape 4 : Obtenez votre clé API

Pour vous authentifier auprès de l’API, nous vous fournirons une nouvelle clé API. En entrant dans la page « Settings », vous pouvez copier la clé API comme indiqué dans l’image.

Étape 5 : Installez l’API

Installez l’API à l’aide du gestionnaire de packages spécifique à votre langage de programmation.

Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec Novita AI LLM. Voici un exemple d’utilisation de l’API chat completions pour les utilisateurs Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Salut !",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Utiliser GPT‑OSS dans TRAE

Étape 1 : Ouvrez Trae et accédez aux modèles

Lancez l’application Trae. Cliquez sur Toggle AI Side Bar dans le coin supérieur droit pour ouvrir la barre latérale AI. Ensuite, allez dans AI Management et sélectionnez Models.

Étape 2 : Ajoutez un modèle personnalisé et choisissez Novita comme fournisseur et sélectionnez les modèles

Cliquez sur le bouton Add Model pour créer une entrée de modèle personnalisée. Dans la boîte de dialogue d’ajout de modèle, sélectionnez Provider = Novita dans le menu déroulant.

Dans le menu déroulant Model, choisissez le modèle souhaité (DeepSeek-R1-0528, Kimi K2, GLM 4.5, DeepSeek-V3-0324 ou MiniMax-M1-80k). Si le modèle exact n’est pas répertorié, saisissez simplement l’ID du modèle que vous avez noté depuis la bibliothèque Novita. Assurez‑vous de choisir la variante correcte du modèle que vous souhaitez utiliser.

Étape 3 : Entrez votre clé API

Copiez la clé API Novita AI depuis votre console Novita et collez‑la dans le champ API Key de Trae.

Obtenez la clé API Novita AI !

Limitation de GPT OSS

Fonctionnalité	GPT-OSS (Modèle auto‑hébergé)	API GPT-5 (Plateforme gérée)
Offre principale	Un modèle brut (le « moteur »)	Une plateforme intégrée complète (la « voiture »)
Capacité du modèle	Forte, mais une génération de retard	État de l’art, raisonnement phare
Outils intégrés	Aucun. Nécessite un effort DIY massif.	Entièrement gérés : Recherche Web, Recherche de fichiers, Interpréteur de code.
Fenêtre de contexte	Pratiquement limitée par votre matériel (par ex., 8k‑32k)	Massive (400k), entièrement gérée.
Cadre d’agent	DIY avec bibliothèques open‑source. Aucune observabilité.	SDK intégré avec observabilité intégrée.
Fonctionnalités entreprise	Aucune. Pas de conformité, SSO ou contrôles administrateur.	Suite complète : SOC 2, HIPAA, RBAC, SSO, etc.
Support	Communautaire et en libre‑service.	Équipe de compte dédiée et support priorisé.
Maintenance	Votre entière responsabilité. Configuration, mise à l’échelle, disponibilité.	Zéro. Gérée entièrement par OpenAI.

Intégrer GPT‑OSS avec TRAE apporte le meilleur des deux mondes :

GPT‑OSS est le « cerveau », contrôlé via le format Harmony pour ajuster la profondeur de raisonnement, structurer les sorties et masquer ou afficher les processus de réflexion.
TRAE est le « corps », offrant un espace de travail intégré, des connexions d’outils et une gestion autonome du cycle de vie logiciel — en particulier en mode SOLO.
Novita AI comble le fossé, en hébergeant GPT‑OSS pour vous afin que vous puissiez l’utiliser via API sans matériel coûteux.

Cette combinaison permet aux développeurs de construire un « Ingénieur IA » personnalisé qui comprend leurs exigences et les exécute exactement comme prévu, rendant possible une livraison logicielle véritablement autonome.

Foire aux questions

Pourquoi utiliser GPT‑OSS avec TRAE plutôt qu’un modèle API closed‑source ?

Vous obtenez un contrôle total. Le format Harmony permet à TRAE de contrôler la profondeur de raisonnement, le format de sortie et si le processus de réflexion est affiché. Vous pouvez également affiner GPT‑OSS sur votre propre code pour un ajustement parfait.

Dois‑je héberger moi‑même GPT‑OSS ?

Non. Des services comme Novita AI l’hébergent pour vous et vous fournissent une clé API, vous n’avez donc pas besoin de GPU coûteux ni de configuration complexe.

Qu’est‑ce que le format Harmony et pourquoi est‑il important ?

C’est un format de message spécial que GPT‑OSS comprend. Il rend les sorties stables, structurées et faciles à traiter pour TRAE — pas besoin d’analyse fragile.

Novita AI est la plateforme cloud tout‑en‑un qui alimente vos ambitions IA. API intégrées, sans serveur, instance GPU — les outils rentables dont vous avez besoin. Éliminez l’infrastructure, commencez gratuitement et faites de votre vision IA une réalité.

Lecture recommandée

Qwen 3 dans les pipelines RAG : LLM, intégration et modèles de reclassement tout‑en‑un

Trae ou Claude Code : lequel est le plus adapté à l’utilisation avec Kimi K2 ?

Coût DeepSeek R1 0528 : comparaison API, GPU, sur site

Utiliser GPT‑OSS dans TRAE : débloquer le format Harmony pour le codage IA