GPT‑OSS in TRAE nutzen: Das Harmony-Format für KI-gestützte Programmierung freischalten

GPT‑OSS in TRAE nutzen: Das Harmony-Format für KI-gestützte Programmierung freischalten

Die KI-gestützte Softwareentwicklung schreitet schnell voran, angetrieben von zwei großen Trends: leistungsstarke Open-Source-Modelle und vollständig integrierte KI-Entwicklungsumgebungen. GPT‑OSS ist OpenAIs Serie von Open-Weight-Modellen, die für starke Schlussfolgerungsfähigkeiten, agentenähnliche Fähigkeiten und tiefgehende Anpassbarkeit bekannt ist. TRAE von ByteDance ist eine KI-IDE, die als vollständiger „KI-Ingenieur“ konzipiert ist und eigenständig Software erstellen kann.

Die Frage ist: Was passiert, wenn Sie die kontrollierbare Schlussfolgerungsleistung von GPT‑OSS mit TRAEs toolreichen, automatisierten Entwicklungsframework kombinieren? Gemeinsam schaffen sie einen Workflow, der sowohl automatisiert als auch genau auf Ihre Anforderungen zugeschnitten ist. Dieser Leitfaden erklärt, wie Sie die beiden verbinden und ihr volles Potenzial ausschöpfen.

Was ist Trae?

TRAE ist auch der Name einer KI-gestützten integrierten Entwicklungsumgebung (IDE), die von ByteDance entwickelt wurde. Sie ist als „KI-Ingenieur“ konzipiert, der eigenständig Softwarelösungen erstellen kann, indem er komplexe Aufgaben versteht und ausführt. TRAE zielt darauf ab, den Entwicklungs-Workflow zu optimieren, indem es Nutzern ermöglicht, Aufgaben an die KI zu delegieren.

trae

Hauptfunktionen von Trae

Erweiterte Tool-Integration & Funktionen (Model Context Protocol – MCP)

  • Externe Tool-Integration: TRAE integriert sich mit verschiedenen externen Tools, sodass KI-Agenten diese für eine effektivere Aufgabenausführung nutzen können.
  • MCP-Unterstützung: Es unterstützt das Model Context Protocol (MCP), einen offenen Standard zur Verbindung von KI-Anwendungen mit externen Datenquellen und Tools. Dies fungiert als universeller „USB-C“-Anschluss für KI und löst die Herausforderung, KI-Modelle mit isolierten Daten zu verbinden.
  • Erweiterte KI-Fähigkeiten: Über MCP können Agenten auf externe Ressourcen wie Google Drive, Slack, GitHub und Datenbanken zugreifen, um komplexe Aufgaben besser zu verstehen und abzuschließen.

Tieferes kontextuelles Verständnis und präzise Steuerung

  • Tiefes Verständnis des Entwicklungskontexts: TRAE versteht Ihren Entwicklungskontext tiefgehend, einschließlich Code-Repositories, Online-Suchergebnissen und gemeinsam genutzten Dokumenten.
  • Präzise Verhaltensanpassung: Sie können Regeln anpassen, um das Verhalten der KI an Ihren Workflow anzupassen, sodass Aufgaben genau wie gewünscht ausgeführt werden.
  • Multimodale Interaktion: Unterstützt das Hochladen von Bildern (z. B. Design-Mockups, Fehler-Screenshots), um Anforderungen zu beschreiben, sodass die KI genaueren Code generieren kann.

CUE: Intelligente Vorhersage & Ein-Klick-Bearbeitung

  • Vorhersage Ihrer nächsten Bearbeitung: Die Funktion CUE (Context Understanding Engine) versteht Ihre Absicht und sagt Ihre nächste Aktion voraus, indem sie Ihr Bearbeitungsverhalten analysiert.
  • Ein-Klick-Navigation & -Anwendung: Drücken Sie einfach die Tab-Taste, um zur nächsten vorgeschlagenen Änderung zu springen oder intelligente Vorschläge auf mehrere Zeilen gleichzeitig anzuwenden.
  • Kontinuierliche Optimierung: Die Funktion wird kontinuierlich für bessere Leistung und Reaktionsfähigkeit optimiert, was ein reibungsloseres Erlebnis bei Codeänderung, -generierung und Fehlerbehebung bietet.

Umfassende IDE-Funktionen & KI-Unterstützung

  • Zwei Entwicklungsmodi: Bietet den IDE-Modus für einen traditionellen, nutzergesteuerten Workflow und den SOLO-Modus, in dem die KI die Entwicklung von den Anforderungen bis zur Auslieferung für volle Automatisierung leitet.
  • Vollwertige IDE: Bietet Standard-IDE-Funktionen wie Code-Bearbeitung, Projektmanagement und Versionskontrolle.
  • KI-Programmierunterstützung: Bietet verschiedene KI-gestützte Hilfen, einschließlich intelligenter Code-Vervollständigung, Refactoring, chatbasierter Q&A und Projektgenerierung aus natürlicher Sprache.
  • Integrierte Web-Vorschau: Unterstützt die direkte Vorschau von Webseiten innerhalb der IDE für einfachere Frontend-Entwicklung und Fehlerbehebung.

Was ist Trae Solo?

What is Trae Solo?

  • Einheitlicher Arbeitsbereich & KI-Tool-Hub:
    Der SOLO-Modus integriert alle notwendigen Entwicklungstools – IDE, Browser, Terminal und Dokumente – direkt in die KI. Dies ermöglicht es der KI, präzise zu schlussfolgern und zu handeln, basierend auf den spezifischen Anforderungen jeder Aufgabe, und schließt nahtlos die Lücke von der Idee zur Ausführung.
  • KI-geführte, durchgängige Entwicklung:
    Sie geben einfach die Anforderungen an, und SOLO übernimmt autonom den gesamten Entwicklungslebenszyklus, einschließlich:
    • Anforderungsanalyse
    • Prototyping
    • Frontend-Entwicklung
    • Backend-Entwicklung
    • Fehlerbehebung & Optimierung
    • Build & Deployment
  • Einheitliche Überwachungsansicht:
    Nutzer können mit der KI chatten und alle Entwicklungsaktivitäten aus einer einzigen, einheitlichen Ansicht überwachen. Die „Erweiterte Ansicht“ bietet einen detaillierten Einblick in alle Echtzeit-Ausführungsdetails.
  • Multimodale Interaktion: „Sprechen“ Sie Ihre Anforderungen:
    Der SOLO-Modus unterstützt Spracheingabe, sodass Sie so natürlich mit TRAE interagieren können wie mit einem menschlichen Teammitglied. Die Ausgabe der KI ist nicht auf Code beschränkt; eine erweiterbare dynamische Ansicht auf der rechten Seite bietet visuelles und intuitives Feedback.
  • Der Kontext-Ingenieur:
    Der SOLO-Modus ist als ultimativer „Kontext-Ingenieur“ konzipiert, der in der Lage ist, den gesamten Umfang Ihrer Arbeit zu verstehen, um sicherzustellen, dass seine Aktionen und Ausgaben auf den umfassendsten und genauesten verfügbaren Informationen basieren.

Zusammenfassend ist das Ziel des TRAE SOLO-Modus, „KI zu ermöglichen, die vollständige Software ausliefert“. Es befähigt Entwickler, durch einen einfachen „Sprechen. Denken. Ausliefern.“-Prozess schneller echte Software zu erstellen und zu veröffentlichen.

Was ist GPT OSS?

GPT-OSS (Open-Source-Serie) ist eine Familie leistungsstarker Open-Weight-Sprachmodelle, die von OpenAI veröffentlicht wurde und für die kommerzielle Nutzung frei verfügbar ist sowie lokal auf Consumer-Hardware ausgeführt werden kann. Die Serie umfasst zwei Hauptmodelle, eine Version mit 20 Milliarden und eine mit 120 Milliarden Parametern, die für starke Schlussfolgerungsfähigkeiten, Tool-Nutzung und Effizienz optimiert sind – dies markiert einen bedeutenden Schritt von OpenAI hin zu größerer Transparenz in der KI-Community. Diese Modelle ermöglichen es Entwicklern und Forschern, sie für benutzerdefinierte Zwecke bei vollständiger Kontrolle über ihre Daten und Infrastruktur fein abzustimmen, und schließen die Lücke zwischen geschlossenen proprietären Systemen und Open-Source-KI.

Modell Ebenen Gesamtparameter Aktive Parameter pro Token Gesamtzahl Experten Aktive Experten pro Token Kontextlänge VRAM-Anforderung pro einzelner GPU
gpt-oss-120b 36 117B 5,1B 128 4 128k 80GB
gpt-oss-20b 24 21B 3,6B 32 4 128k 16GB

gpt oss benchmark

Warum GPT OSS für KI-gestützte Programmierung wählen?

Format anpassen: Harmony

GPT‑OSS-Modelle verwenden ein spezielles Gesprächsformat namens Harmony. Dieses Format organisiert Nachrichten in klare Rollen – system, user und assistant – und ermöglicht es Ihnen, zu steuern, wie das Modell denkt und antwortet. Mit Harmony können Sie die Schlussfolgerungstiefe (niedrig, mittel, hoch) anpassen, entscheiden, ob der Denkprozess angezeigt oder ausgeblendet werden soll, und das Modell veranlassen, Funktionen auf stabile, strukturierte Weise aufzurufen. Viele andere Open-Source-Modelle haben diese Steuerungen nicht eingebaut, aber GPT‑OSS versteht sie nativ, da es trainiert wurde, Harmony-Anweisungen zu befolgen. Dies macht es einfacher, konsistente, zuverlässige und toolfreundliche Ausgaben zu erhalten.

Was Harmony steuern kann

Das Harmony-Format ermöglicht es Ihnen, mehrere wichtige Verhaltensparameter für GPT‑OSS-Modelle anzupassen:

Parameter Beschreibung Beispiel
Schlussfolgerungstiefe Steuert, wie viel schrittweises Denken das Modell durchführt. "Reasoning: low", "Reasoning: medium", "Reasoning: high"
Funktionsaufruf Native Unterstützung für JSON-Ausgaben im OpenAI-Stil function_call / tool_calls. "Always call function weather_api when asked about weather"
Sichtbarkeit der Schlussfolgerung Zeigen oder Ausblenden der vollständigen Gedankenkette in <think>-Tags. "Show reasoning" / "Hide reasoning"
Ausgabeformatregeln Erzwingen strukturierter Ausgaben wie JSON, Markdown usw. "Output in JSON format"

Ein Beispiel für eine Harmony-Anfrage

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Explain how quicksort works."
    }
  ]
}

Vorteile bei der Nutzung von Harmony mit Tools wie Trae

Bei Integration mit Plattformen zur Codegenerierung, Fehlerbehebung und Ausführung wie Trae bietet das Harmony-Format mehrere praktische Vorteile:

  1. Stabile strukturierte Ausgabe
    • Harmony stellt sicher, dass die Ausgabe des Modells einem vorhersagbaren JSON- oder Codeblock-Format folgt.
    • Trae kann dies direkt ohne fragile Regex oder Nachbearbeitung parsen.
  2. Steuerung der Schlussfolgerungstiefe
    • Nutzen Sie niedrige Schlussfolgerung für schnelles Prototyping oder einfachen Code.
    • Nutzen Sie hohe Schlussfolgerung für komplexe Algorithmen, bei denen Korrektheit am wichtigsten ist.
    • Spart GPU/CPU-Ressourcen, indem der Schlussfolgerungsaufwand an die Aufgabenkomplexität angepasst wird.
  3. Sichtbarkeit der Schlussfolgerung umschalten
    • Zeigen Sie <think>-Schlussfolgerungen zur Fehlerbehebung und zum Lernen an.
    • Blenden Sie Schlussfolgerungen in der Produktion aus, um Token zu reduzieren und das Durchsickern interner Logik zu vermeiden.
  4. Klares Kontextmanagement über mehrere Turns
    • system-Regeln bleiben über Turns hinweg bestehen und gewährleisten konsistenten Code-Stil und Ausführungsregeln.
    • Einfaches Iterieren: Passen Sie Benutzeranweisungen an, ohne globale Einstellungen zu verlieren.
  5. Nahtlose API-Integration
    • Harmony ahmt die OpenAI Responses API nach, sodass jede Toolchain oder jedes IDE-Plugin, das mit OpenAI kompatibel ist, mit minimalen Änderungen mit GPT‑OSS funktioniert.

GPT OSS Tool-Nutzung

GPT‑OSS-Modelle sind trainiert, um externe Tools nativ als Teil ihres Schlussfolgerungsprozesses zu nutzen, mit eingebauter Unterstützung für Browsen, Python-Ausführung und Datei-Patching. Diese Tools werden aktiviert, indem sie in der system-Nachricht eines Harmony-formatierten Prompts definiert werden.

1. Browser-Tool

  • Zweck: Das Web durchsuchen, Seiten öffnen und Text auf Seiten finden.
  • Methoden:
    • search – Schlüsselphrasen suchen.
    • open – Eine bestimmte Seite öffnen.
    • find – Inhalt auf einer Seite lokalisieren.
  • Funktionen:
    • Scrollbares Textfenster zur Verwaltung der Kontextgröße.
    • Caching für schnellere Wiederbesuche derselben Seite.
    • Trainiert, Quellen in Antworten zu zitieren.
  • Nutzung: Fügen Sie die Browser-Tool-Definition über .with_browser() oder .with_tools() im system-Prompt hinzu.
  • Hinweis: Die Referenzimplementierung dient nur zu Bildungszwecken – verwenden Sie in der Produktion Ihr eigenes Backend.

2. Python-Tool

  • Zweck: Berechnungen durchführen oder kleine Programme als Teil der Gedankenkette ausführen.
  • Funktionen:
    • Trainiert mit einem zustandsbehafteten Python-Tool für mehrstufige Schlussfolgerung.
    • Die Referenzimplementierung verwendet einen zustandslosen Modus.
    • Kann Standard-Tool-Beschreibungen in openai‑harmony überschreiben.
  • Nutzung: Fügen Sie es über .with_python() oder .with_tools() im system-Prompt hinzu.
  • Sicherheitswarnung: Der Referenzcode läuft in einem permissiven Docker-Container – fügen Sie in der Produktion Ihre eigenen Einschränkungen hinzu.

3. Patch-Anwenden-Tool

  • Zweck: Lokale Dateien erstellen, aktualisieren oder löschen.
  • Anwendungsfall: Code oder Projektdateien als Teil eines automatisierten Entwicklungszyklus ändern.

Wie nutzt man GPT OSS in Trae?

Voraussetzungen: API-Schlüssel abrufen

Novita AI bietet GPT-OSS 120B-APIs mit 131K Kontext und Kosten von $0,1/Eingabe und $0,5/Ausgabe. Novita AI bietet außerdem GPT-OSS 20B mit 131K Kontext und Kosten von $0,05/Eingabe und $0,2/Ausgabe, was eine starke Unterstützung für die Maximierung des Code-Agenten-Potenzials von GPT OSS bietet.

Novita AI

Schritt 1: Einloggen und auf die Modellbibliothek zugreifen

Melden Sie sich bei Ihrem Konto an und klicken Sie auf die Schaltfläche Modellbibliothek.

Log In and Access the Model Library

Probieren Sie GPT OSS jetzt aus!

Schritt 2: Wählen Sie Ihr Modell

Durchstöbern Sie die verfügbaren Optionen und wählen Sie das Modell, das Ihren Anforderungen entspricht.

Step 2: Choose Your Model

Schritt 3: Starten Sie Ihre kostenlose Testversion

Starten Sie Ihre kostenlose Testversion, um die Funktionen des ausgewählten Modells zu erkunden.

Step 3: Start Your Free Trial

Schritt 4: Holen Sie sich Ihren API-Schlüssel

Zur Authentifizierung bei der API stellen wir Ihnen einen neuen API-Schlüssel zur Verfügung. Auf der Seite „Einstellungen“ können Sie den API-Schlüssel wie in der Abbildung gezeigt kopieren.

get api key

Schritt 5: Installieren Sie die API

Installieren Sie die API über den für Ihre Programmiersprache spezifischen Paketmanager.

Nach der Installation importieren Sie die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit dem Novita AI LLM zu interagieren. Dies ist ein Beispiel für die Nutzung der Chat-Completions-API für Python-Nutzer.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

GPT‑OSS in TRAE nutzen

Schritt 1: Öffnen Sie Trae und greifen Sie auf Modelle zu

Starten Sie die Trae-App. Klicken Sie auf die Schaltfläche „KI-Seitenleiste umschalten“ in der oberen rechten Ecke, um die KI-Seitenleiste zu öffnen. Gehen Sie dann zu KI-Verwaltung und wählen Sie Modelle.

Toggle AI Side Bar

go to AI Management and select Models

Schritt 2: Fügen Sie ein benutzerdefiniertes Modell hinzu, wählen Sie Novita als Anbieter und wählen Sie Modelle

Klicken Sie auf die Schaltfläche Modell hinzufügen, um einen benutzerdefinierten Modelleintrag zu erstellen. Wählen Sie im Dialog „Modell hinzufügen“ aus dem Dropdown-Menü Anbieter = Novita.

Wählen Sie aus dem Modell-Dropdown das gewünschte Modell aus (DeepSeek-R1-0528, Kimi K2, GLM 4.5, DeepSeek-V3-0324 oder MiniMax-M1-80k). Wenn das genaue Modell nicht aufgeführt ist, geben Sie einfach die Modell-ID ein, die Sie aus der Novita-Bibliothek notiert haben. Stellen Sie sicher, dass Sie die richtige Variante des Modells auswählen, das Sie verwenden möchten.

Add a Custom Model

Choose Novita as Prov

Schritt 3: Geben Sie Ihren API-Schlüssel ein

Kopieren Sie den Novita AI API-Schlüssel aus Ihrer Novita-Konsole und fügen Sie ihn in das Feld „API-Schlüssel“ in Trae ein.

get api key

Holen Sie sich den Novita AI API-Schlüssel!

Einschränkungen von GPT OSS

Funktion GPT-OSS (Selbst gehostetes Modell) GPT-5 API (Verwaltete Plattform)
Kernangebot Ein rohes Modell (der „Motor“) Eine vollständige, integrierte Plattform (das „Auto“)
Modellfähigkeit Stark, aber eine Generation zurück State-of-the-Art, Flaggschiff-Schlussfolgerung
Eingebaute Tools Keine. Erfordert großen DIY-Aufwand. Vollständig verwaltet: Websuche, Dateisuche, Code-Interpreter.
Kontextfenster Praktisch durch Ihre Hardware begrenzt (z. B. 8k-32k) Massiv (400k), vollständig verwaltet.
Agenten-Framework DIY mit Open-Source-Bibliotheken. Keine Beobachtbarkeit. Integriertes SDK mit eingebauter Beobachtbarkeit.
Unternehmensfunktionen Keine. Keine Compliance, SSO oder Admin-Steuerungen. Vollständige Suite: SOC 2, HIPAA, RBAC, SSO usw.
Support Community-basiert und Self-Service. Engagiertes Account-Team und priorisierter Support.
Wartung Ihre volle Verantwortung. Einrichtung, Skalierung, Betriebszeit. Null. Wird vollständig von OpenAI übernommen.

Die Integration von GPT‑OSS mit TRAE vereint das Beste aus beiden Welten:

  • GPT‑OSS ist das „Gehirn“, das über das Harmony-Format gesteuert wird, um Schlussfolgerungstiefe anzupassen, Ausgaben zu strukturieren und Denkprozesse ein- oder auszublenden.
  • TRAE ist der „Körper“, der einen integrierten Arbeitsbereich, Tool-Verbindungen und autonomes Software-Lebenszyklus-Management bietet – insbesondere im SOLO-Modus.
  • Novita AI schließt die Lücke, indem es GPT‑OSS für Sie hostet, sodass Sie es über API ohne teure Hardware nutzen können.

Diese Kombination ermöglicht es Entwicklern, einen benutzerdefinierten „KI-Ingenieur“ zu erstellen, der ihre Anforderungen versteht und diese genau wie beabsichtigt ausführt, was eine wirklich autonome Softwareauslieferung möglich macht.

Häufig gestellte Fragen

Warum GPT‑OSS mit TRAE anstelle eines closed-source-API-Modells verwenden?

Sie erhalten volle Kontrolle. Das Harmony-Format ermöglicht es TRAE, die Schlussfolgerungstiefe, das Ausgabeformat und die Anzeige des Denkprozesses zu steuern. Sie können GPT‑OSS außerdem an Ihren eigenen Code fein abstimmen, um eine perfekte Passform zu erhalten.

Muss ich GPT‑OSS selbst hosten?

Nein. Dienste wie Novita AI hosten es für Sie und geben Ihnen einen API-Schlüssel, sodass Sie keine teuren GPUs oder komplexe Einrichtung benötigen.

Was ist das Harmony-Format und warum ist es wichtig?

Es ist ein spezielles Nachrichtenformat, das GPT‑OSS versteht. Es macht Ausgaben stabil, strukturiert und einfach für TRAE zu verarbeiten – keine fragile Parsing erforderlich.

Novita AI ist die All-in-One-Cloud-Plattform, die Ihre KI-Ambitionen unterstützt. Integrierte APIs, Serverless, GPU-Instanzen – die kostengünstigen Tools, die Sie benötigen. Eliminieren Sie Infrastruktur, starten Sie kostenlos und machen Sie Ihre KI-Vision zur Realität.

Empfohlene Lektüre

Qwen 3 in RAG-Pipelines: All-in-One LLM, Einbettungs- und Reranking-Modelle

Trae oder Claude Code: Welches eignet sich besser für die Nutzung mit Kimi K2?

DeepSeek R1 0528 Kosten: API, GPU, Vor-Ort-Vergleich