Utiliser GPT‑OSS dans TRAE : Débloquer le format Harmony pour le codage IA

Utiliser GPT‑OSS dans TRAE : Débloquer le format Harmony pour le codage IA

Le développement logiciel alimenté par l’IA évolue rapidement, porté par deux grandes tendances : des modèles open source puissants et des environnements de développement IA entièrement intégrés. GPT‑OSS est la série de modèles à poids ouverts d’OpenAI, réputée pour ses solides capacités de raisonnement, ses fonctionnalités similaires à celles d’un agent et sa personnalisation poussée. TRAE, développé par ByteDance, est un EDI IA conçu pour fonctionner comme un « Ingénieur IA » complet capable de développer des logiciels de manière autonome.

La question est : que se passe-t-il lorsque vous combinez la puissance de raisonnement contrôlable de GPT‑OSS avec le framework de développement automatisé et riche en outils de TRAE ? Ensemble, ils créent un flux de travail à la fois automatisé et parfaitement adapté à vos besoins précis. Ce guide explique comment les connecter et débloquer tout leur potentiel.

Qu’est-ce que Trae ?

TRAE est également le nom d’un environnement de développement intégré (EDI) alimenté par l’IA créé par ByteDance. Il est conçu pour fonctionner comme un « Ingénieur IA » capable de développer des solutions logicielles de manière autonome en comprenant des tâches complexes et en les exécutant. TRAE vise à simplifier le flux de travail de développement en permettant aux utilisateurs de déléguer des tâches à l’IA.

trae

Fonctions clés de Trae

Intégration et capacités d’outils améliorées (Protocole de contexte de modèle - MCP)

  • Intégration d’outils externes : TRAE s’intègre à divers outils externes, permettant aux agents IA de les utiliser pour une exécution des tâches plus efficace.
  • Prise en charge MCP : Il prend en charge le Protocole de contexte de modèle (MCP), une norme ouverte permettant de connecter des applications IA à des sources de données et des outils externes. Cela fonctionne comme un port « USB-C » universel pour l’IA, résolvant le défi de la connexion des modèles IA à des données cloisonnées.
  • Capacités IA étendues : Via le MCP, les agents peuvent accéder à des ressources externes comme Google Drive, Slack, GitHub et des bases de données pour mieux comprendre et réaliser des tâches complexes.

Compréhension contextuelle plus poussée et contrôle précis

  • Compréhension approfondie du contexte de développement : TRAE comprend en profondeur votre contexte de développement, y compris les dépôts de code, les résultats de recherche en ligne et les documents partagés.
  • Personnalisation précise du comportement : Vous pouvez personnaliser des règles pour adapter le comportement de l’IA à votre flux de travail, en veillant à ce qu’elle exécute les tâches exactement comme vous le souhaitez.
  • Interaction multimodale : Prend en charge le téléchargement d’images (par exemple, maquettes de conception, captures d’écran d’erreurs) pour aider à décrire les exigences, permettant à l’IA de générer du code plus précis.

CUE : Prédiction intelligente et édition en une touche

  • Prédit votre prochaine modification : La fonctionnalité CUE (moteur de compréhension du contexte) comprend votre intention et prédit votre prochaine action en analysant votre comportement d’édition.
  • Navigation et application en une touche : Appuyez simplement sur la touche Tab pour passer à la modification suggérée suivante ou appliquer des suggestions intelligentes sur plusieurs lignes à la fois.
  • Optimisation continue : La fonctionnalité est continuellement optimisée pour de meilleures performances et réactivité, offrant une expérience plus fluide pour la modification, la génération de code et la correction de bugs.

Fonctionnalités EDI complètes et assistance IA

  • Deux modes de développement : Propose le mode EDI pour un flux de travail traditionnel contrôlé par l’utilisateur, et le mode SOLO dans lequel l’IA pilote le développement des exigences à la livraison pour une automatisation complète.
  • EDI complet : Fournit des fonctionnalités EDI standard comme l’édition de code, la gestion de projet et le contrôle de version.
  • Assistance à la programmation IA : Dispose de diverses assistances alimentées par l’IA, notamment la complétion de code intelligente, le refactoring, le Q&A par chat et la génération de projet à partir de langage naturel.
  • Aperçu web intégré : Prend en charge l’aperçu direct des pages web dans l’EDI pour faciliter le développement et le débogage front-end.

Qu’est-ce que Trae Solo ?

What is Trae Solo?

  • Espace de travail unifié et hub d’outils IA :
    Le mode SOLO intègre tous les outils de développement nécessaires — l’EDI, le navigateur, le terminal et les documents — directement dans l’IA. Cela permet à l’IA de raisonner et d’agir avec précision en fonction des besoins spécifiques de chaque tâche, comblant sans faille le fossé entre l’idée et l’exécution.
  • Développement de bout en bout piloté par l’IA :
    Vous n’avez qu’à fournir les exigences, et SOLO gère de manière autonome l’ensemble du cycle de vie du développement, y compris :
    • Analyse des exigences
    • Prototypage
    • Développement front-end
    • Développement back-end
    • Débogage et optimisation
    • Construction et déploiement
  • Vue de surveillance unifiée :
    Les utilisateurs peuvent discuter avec l’IA et surveiller toutes les activités de développement à partir d’une vue unique et unifiée. La « Vue étendue » offre un aperçu détaillé de tous les détails d’exécution en temps réel.
  • Interaction multimodale : « Exprimez » vos exigences :
    Le mode SOLO prend en charge la saisie vocale, vous permettant d’interagir avec TRAE aussi naturellement qu’avec un coéquipier humain. La sortie de l’IA n’est pas limitée au code ; une vue dynamique extensible sur la droite fournit un retour visuel et intuitif.
  • L’ingénieur de contexte :
    Le mode SOLO est conçu pour être l’« Ingénieur de contexte » ultime, capable de comprendre l’ensemble du périmètre de votre travail pour garantir que ses actions et ses sorties sont basées sur les informations les plus complètes et précises disponibles.

En résumé, l’objectif du mode SOLO de TRAE est de permettre une « IA qui livre des logiciels complets ». Il permet aux développeurs de créer et de publier des logiciels réels plus rapidement grâce à un processus simple « Parlez. Réfléchissez. Livrez. ».

Qu’est-ce que GPT OSS ?

GPT-OSS (série Open Source) est une famille de modèles de langage puissants, à poids ouverts, publiés par OpenAI, conçus pour être disponibles gratuitement pour un usage commercial et pouvant être exécutés localement sur du matériel grand public. La série comprend deux modèles principaux, une version à 20 milliards et une version à 120 milliards de paramètres, optimisés pour un raisonnement solide, l’utilisation d’outils et l’efficacité, marquant un changement significatif d’OpenAI vers une plus grande transparence au sein de la communauté IA. Ces modèles permettent aux développeurs et aux chercheurs de les affiner pour des objectifs personnalisés, avec un contrôle total sur leurs données et leur infrastructure, comblant le fossé entre les systèmes propriétaires fermés et l’IA open source.

Modèle Couches Paramètres totaux Paramètres actifs par token Experts totaux Experts actifs par token Longueur de contexte Exigence de VRAM pour un seul GPU
gpt-oss-120b 36 117B 5.1B 128 4 128k 80GB
gpt-oss-20b 24 21B 3.6B 32 4 128k 16GB

gpt oss benchmark

Pourquoi choisir GPT OSS pour le codage IA ?

Personnaliser le format : Harmony

Les modèles GPT‑OSS utilisent un format de conversation spécial appelé Harmony. Ce format organise les messages dans des rôles clairs — system, user et assistant — et vous permet de contrôler la façon dont le modèle pense et répond. Avec Harmony, vous pouvez ajuster la profondeur de raisonnement (faible, moyenne, élevée), décider d’afficher ou de masquer le processus de réflexion, et faire en sorte que le modèle appelle des fonctions de manière stable et structurée. De nombreux autres modèles open source n’ont pas ces contrôles intégrés, mais GPT‑OSS les comprend nativement car il a été entraîné pour suivre les instructions Harmony. Cela permet d’obtenir plus facilement des sorties cohérentes, fiables et adaptées aux outils.

Ce que Harmony peut contrôler

Le format Harmony vous permet d’ajuster plusieurs paramètres de comportement clés pour les modèles GPT‑OSS :

Paramètre Description Exemple
Profondeur de raisonnement Contrôle la quantité de réflexion étape par étape effectuée par le modèle. "Reasoning: low", "Reasoning: medium", "Reasoning: high"
Appel de fonctions Prise en charge native des sorties JSON de style OpenAI function_call / tool_calls. "Always call function weather_api when asked about weather"
Visibilité du raisonnement Afficher ou masquer l’ensemble de la chaîne de pensée dans les balises <think>. "Show reasoning" / "Hide reasoning"
Règles de format de sortie Forcer une sortie structurée comme JSON, Markdown, etc. "Output in JSON format"

Exemple de requête Harmony

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Explain how quicksort works."
    }
  ]
}

Avantages de l’utilisation de Harmony avec des outils comme Trae

Lorsqu’il est intégré à des plateformes de génération de code, de débogage et d’exécution comme Trae, le format Harmony offre plusieurs avantages pratiques :

  1. Sortie structurée stable
    • Harmony garantit que la sortie du modèle suit un format JSON ou bloc de code prévisible.
    • Trae peut l’analyser directement sans regex fragiles ni post-traitement.
  2. Contrôle de la profondeur de raisonnement
    • Utilisez un raisonnement faible pour le prototypage rapide ou le code simple.
    • Utilisez un raisonnement élevé pour les algorithmes complexes où l’exactitude est primordiale.
    • Économise les ressources GPU/CPU en adaptant le coût du raisonnement à la complexité de la tâche.
  3. Basculer la visibilité du raisonnement
    • Affichez le raisonnement <think> pour le débogage et l’apprentissage.
    • Masquez le raisonnement en production pour réduire le nombre de tokens et éviter de fuir la logique interne.
  4. Gestion de contexte multi-tours claire
    • Les règles system persistent entre les tours, garantissant un style de code et des règles d’exécution cohérents.
    • Facile à itérer : modifiez les instructions utilisateur sans perdre les paramètres globaux.
  5. Intégration API transparente
    • Harmony imite l’API Responses d’OpenAI, donc toute chaîne d’outils ou plugin d’EDI compatible avec OpenAI peut fonctionner avec GPT‑OSS avec des modifications minimales.

Utilisation des outils GPT OSS

Les modèles GPT‑OSS sont entraînés pour utiliser nativement des outils externes dans le cadre de leur processus de raisonnement, avec une prise en charge intégrée de la navigation, de l’exécution Python et de l’application de correctifs de fichiers. Ces outils sont activés en les définissant dans le message system d’une invite au format Harmony.

1. Outil de navigation

  • Objectif : Rechercher sur le web, ouvrir des pages et trouver du texte sur celles-ci.
  • Méthodes :
    • search — rechercher des phrases clés.
    • open — ouvrir une page spécifique.
    • find — localiser du contenu sur une page.
  • Fonctionnalités :
    • Fenêtre de texte défilante pour gérer la taille du contexte.
    • Mise en cache pour des revisites plus rapides de la même page.
    • Entraîné pour citer les sources dans les réponses.
  • Utilisation : Ajoutez la définition de l’outil de navigation via .with_browser() ou .with_tools() dans l’invite system.
  • Remarque : L’implémentation de référence est à but éducatif uniquement — utilisez votre propre backend en production.

2. Outil Python

  • Objectif : Effectuer des calculs ou exécuter de petits programmes dans le cadre de la chaîne de pensée.
  • Fonctionnalités :
    • Entraîné avec un outil Python avec état pour un raisonnement multi-étapes.
    • L’implémentation de référence utilise un mode sans état.
    • Peut remplacer les descriptions d’outils par défaut dans openai‑harmony.
  • Utilisation : Ajoutez-le via .with_python() ou .with_tools() dans l’invite system.
  • Avertissement de sécurité : Le code de référence s’exécute dans un conteneur Docker permissif — ajoutez vos propres restrictions en production.

3. Outil d’application de correctifs

  • Objectif : Créer, mettre à jour ou supprimer des fichiers locaux.
  • Cas d’usage : Modifier du code ou des fichiers de projet dans le cadre d’une boucle de développement automatisée.

Comment utiliser GPT OSS dans Trae ?

Prérequis : Obtenir une clé API

Novita AI propose des API GPT-OSS 120B
avec un contexte de 131K et des coûts de 0,1 $ par entrée et 0,5 $ par sortie. Novita AI propose également GPT-OSS 20B avec un contexte de 131 et des coûts de 0,05 $ par entrée et 0,2 $ par sortie, offrant un soutien solide pour maximiser le potentiel d’agent de codage de GPT OSS.

Novita AI

Étape 1 : Se connecter et accéder à la bibliothèque de modèles

Connectez-vous à votre compte et cliquez sur le bouton Bibliothèque de modèles.

Log In and Access the Model Library

Essayez GPT OSS maintenant !

Étape 2 : Choisir votre modèle

Parcourez les options disponibles et sélectionnez le modèle qui correspond à vos besoins.

Step 2: Choose Your Model

Étape 3 : Démarrer votre essai gratuit

Commencez votre essai gratuit pour explorer les capacités du modèle sélectionné.

Step 3: Start Your Free Trial

Étape 4 : Obtenir votre clé API

Pour vous authentifier auprès de l’API, nous vous fournirons une nouvelle clé API. En accédant à la page « Paramètres », vous pouvez copier la clé API comme indiqué sur l’image.

get api key

Obtenez votre clé API Novita AI !

Étape 5 : Installer l’API

Installez l’API à l’aide du gestionnaire de packages spécifique à votre langage de programmation.

Après l’installation, importez les bibliothèques nécessaires dans votre environnement de développement. Initialisez l’API avec votre clé API pour commencer à interagir avec le LLM Novita AI. Ceci est un exemple d’utilisation de l’API de complétion de chat pour les utilisateurs Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Utiliser GPT‑OSS dans TRAE

Étape 1 : Ouvrir Trae et accéder aux modèles

Lancez l’application Trae. Cliquez sur le bouton de bascule de la barre latérale IA dans le coin supérieur droit pour ouvrir la Barre latérale IA. Ensuite, allez dans Gestion de l’IA et sélectionnez Modèles.

Toggle AI Side Bar

go to AI Management and select Models

Étape 2 : Ajouter un modèle personnalisé, choisir Novita comme fournisseur et sélectionner les modèles

Cliquez sur le bouton Ajouter un modèle pour créer une entrée de modèle personnalisé. Dans la boîte de dialogue d’ajout de modèle, sélectionnez Fournisseur = Novita dans le menu déroulant.

Dans le menu déroulant Modèle, choisissez le modèle souhaité (DeepSeek-R1-0528, Kimi K2, GLM 4.5, DeepSeek-V3-0324 ou MiniMax-M1-80k). Si le modèle exact n’est pas répertorié, saisissez simplement l’ID du modèle que vous avez noté dans la bibliothèque Novita. Assurez-vous de choisir la variante correcte du modèle que vous souhaitez utiliser.

Add a Custom Model

Choose Novita as Prov

Étape 3 : Saisir votre clé API

Copiez la clé API Novita AI depuis votre console Novita et collez-la dans le champ Clé API de Trae.

get api key

Obtenez votre clé API Novita AI !

Limites de GPT OSS

Fonctionnalité GPT-OSS (modèle auto-hébergé) API GPT-5 (plateforme gérée)
Offre principale Un modèle brut (le « moteur ») Une plateforme complète et intégrée (la « voiture »)
Capacité du modèle Solide, mais une génération en retard De pointe, raisonnement de référence
Outils intégrés Aucun. Nécessite un effort de bricolage (DIY) massif. Entièrement gérés : Recherche web, recherche de fichiers, interpréteur de code.
Fenêtre de contexte Pratiquement limitée par votre matériel (par exemple 8k-32k) Massive (400k), entièrement gérée.
Framework d’agent DIY avec des bibliothèques open source. Pas d’observabilité. SDK intégré avec observabilité intégrée.
Fonctionnalités entreprise Aucune. Pas de conformité, SSO ou contrôles administrateur. Suite complète : SOC 2, HIPAA, RBAC, SSO, etc.
Support Basé sur la communauté et en libre-service. Équipe de compte dédiée et support prioritaire.
Maintenance Votre pleine responsabilité. Installation, mise à l’échelle, disponibilité. Zéro. Entièrement gérée par OpenAI.

L’intégration de GPT‑OSS avec TRAE offre le meilleur des deux mondes :

  • GPT‑OSS est le « cerveau », contrôlé via le format Harmony pour ajuster la profondeur de raisonnement, structurer les sorties et masquer ou afficher les processus de pensée.
  • TRAE est le « corps », offrant un espace de travail intégré, des connexions d’outils et une gestion autonome du cycle de vie logiciel — notamment en mode SOLO.
  • Novita AI fait le lien, en hébergeant GPT‑OSS pour vous afin que vous puissiez l’utiliser via API sans matériel coûteux.

Cette combinaison permet aux développeurs de créer un « Ingénieur IA » personnalisé qui comprend leurs exigences et les exécute exactement comme prévu, rendant possible une livraison logicielle véritablement autonome.

Questions fréquemment posées

Pourquoi utiliser GPT‑OSS avec TRAE plutôt qu’un modèle d’API propriétaire fermé ?

Vous bénéficiez d’un contrôle total. Le format Harmony permet à TRAE de contrôler la profondeur de raisonnement, le format de sortie et l’affichage ou non du processus de pensée. Vous pouvez également affiner GPT‑OSS sur votre propre code pour un ajustement parfait.

Dois-je héberger GPT‑OSS moi-même ?

Non. Des services comme Novita AI l’hébergent pour vous et vous fournissent une clé API, vous n’avez donc pas besoin de GPU coûteux ni de configuration complexe.

Qu’est-ce que le format Harmony et pourquoi est-il important ?

C’est un format de message spécial que GPT‑OSS comprend. Il rend les sorties stables, structurées et faciles à traiter pour TRAE — pas besoin d’analyse fragile.

Novita AI est la plateforme cloud tout-en-un qui donne vie à vos ambitions IA. API intégrées, serverless, instances GPU — les outils rentables dont vous avez besoin. Éliminez l’infrastructure, commencez gratuitement et concrétisez votre vision IA.

Lectures recommandées

Qwen 3 dans les pipelines RAG : Modèles LLM, d’embedding et de reranking tout-en-un

Trae ou Claude Code : Lequel est le plus adapté pour utiliser avec Kimi K2 ?

Coût de DeepSeek R1 0528 : Comparaison API, GPU, sur site