Die KI-gestützte Softwareentwicklung schreitet schnell voran, angetrieben von zwei großen Trends: leistungsstarke Open-Source-Modelle und vollständig integrierte KI-Entwicklungsumgebungen. GPT‑OSS ist OpenAIs Serie von Open-Weight-Modellen, die für starke Schlussfolgerungsfähigkeiten, agentenähnliche Fähigkeiten und tiefgehende Anpassbarkeit bekannt ist. TRAE von ByteDance ist eine KI-IDE, die als vollständiger „KI-Ingenieur“ konzipiert ist und eigenständig Software erstellen kann.
Die Frage ist: Was passiert, wenn Sie die kontrollierbare Schlussfolgerungsleistung von GPT‑OSS mit TRAEs toolreichen, automatisierten Entwicklungsframework kombinieren? Gemeinsam schaffen sie einen Workflow, der sowohl automatisiert als auch genau auf Ihre Anforderungen zugeschnitten ist. Dieser Leitfaden erklärt, wie Sie die beiden verbinden und ihr volles Potenzial ausschöpfen.
Was ist Trae?
TRAE ist auch der Name einer KI-gestützten integrierten Entwicklungsumgebung (IDE), die von ByteDance entwickelt wurde. Sie ist als „KI-Ingenieur“ konzipiert, der eigenständig Softwarelösungen erstellen kann, indem er komplexe Aufgaben versteht und ausführt. TRAE zielt darauf ab, den Entwicklungs-Workflow zu optimieren, indem es Nutzern ermöglicht, Aufgaben an die KI zu delegieren.

Hauptfunktionen von Trae
Erweiterte Tool-Integration & Funktionen (Model Context Protocol – MCP)
- Externe Tool-Integration: TRAE integriert sich mit verschiedenen externen Tools, sodass KI-Agenten diese für eine effektivere Aufgabenausführung nutzen können.
- MCP-Unterstützung: Es unterstützt das Model Context Protocol (MCP), einen offenen Standard zur Verbindung von KI-Anwendungen mit externen Datenquellen und Tools. Dies fungiert als universeller „USB-C“-Anschluss für KI und löst die Herausforderung, KI-Modelle mit isolierten Daten zu verbinden.
- Erweiterte KI-Fähigkeiten: Über MCP können Agenten auf externe Ressourcen wie Google Drive, Slack, GitHub und Datenbanken zugreifen, um komplexe Aufgaben besser zu verstehen und abzuschließen.
Tieferes kontextuelles Verständnis und präzise Steuerung
- Tiefes Verständnis des Entwicklungskontexts: TRAE versteht Ihren Entwicklungskontext tiefgehend, einschließlich Code-Repositories, Online-Suchergebnissen und gemeinsam genutzten Dokumenten.
- Präzise Verhaltensanpassung: Sie können Regeln anpassen, um das Verhalten der KI an Ihren Workflow anzupassen, sodass Aufgaben genau wie gewünscht ausgeführt werden.
- Multimodale Interaktion: Unterstützt das Hochladen von Bildern (z. B. Design-Mockups, Fehler-Screenshots), um Anforderungen zu beschreiben, sodass die KI genaueren Code generieren kann.
CUE: Intelligente Vorhersage & Ein-Klick-Bearbeitung
- Vorhersage Ihrer nächsten Bearbeitung: Die Funktion CUE (Context Understanding Engine) versteht Ihre Absicht und sagt Ihre nächste Aktion voraus, indem sie Ihr Bearbeitungsverhalten analysiert.
- Ein-Klick-Navigation & -Anwendung: Drücken Sie einfach die
Tab-Taste, um zur nächsten vorgeschlagenen Änderung zu springen oder intelligente Vorschläge auf mehrere Zeilen gleichzeitig anzuwenden. - Kontinuierliche Optimierung: Die Funktion wird kontinuierlich für bessere Leistung und Reaktionsfähigkeit optimiert, was ein reibungsloseres Erlebnis bei Codeänderung, -generierung und Fehlerbehebung bietet.
Umfassende IDE-Funktionen & KI-Unterstützung
- Zwei Entwicklungsmodi: Bietet den IDE-Modus für einen traditionellen, nutzergesteuerten Workflow und den SOLO-Modus, in dem die KI die Entwicklung von den Anforderungen bis zur Auslieferung für volle Automatisierung leitet.
- Vollwertige IDE: Bietet Standard-IDE-Funktionen wie Code-Bearbeitung, Projektmanagement und Versionskontrolle.
- KI-Programmierunterstützung: Bietet verschiedene KI-gestützte Hilfen, einschließlich intelligenter Code-Vervollständigung, Refactoring, chatbasierter Q&A und Projektgenerierung aus natürlicher Sprache.
- Integrierte Web-Vorschau: Unterstützt die direkte Vorschau von Webseiten innerhalb der IDE für einfachere Frontend-Entwicklung und Fehlerbehebung.
Was ist Trae Solo?

- Einheitlicher Arbeitsbereich & KI-Tool-Hub:
Der SOLO-Modus integriert alle notwendigen Entwicklungstools – IDE, Browser, Terminal und Dokumente – direkt in die KI. Dies ermöglicht es der KI, präzise zu schlussfolgern und zu handeln, basierend auf den spezifischen Anforderungen jeder Aufgabe, und schließt nahtlos die Lücke von der Idee zur Ausführung. - KI-geführte, durchgängige Entwicklung:
Sie geben einfach die Anforderungen an, und SOLO übernimmt autonom den gesamten Entwicklungslebenszyklus, einschließlich:- Anforderungsanalyse
- Prototyping
- Frontend-Entwicklung
- Backend-Entwicklung
- Fehlerbehebung & Optimierung
- Build & Deployment
- Einheitliche Überwachungsansicht:
Nutzer können mit der KI chatten und alle Entwicklungsaktivitäten aus einer einzigen, einheitlichen Ansicht überwachen. Die „Erweiterte Ansicht“ bietet einen detaillierten Einblick in alle Echtzeit-Ausführungsdetails. - Multimodale Interaktion: „Sprechen“ Sie Ihre Anforderungen:
Der SOLO-Modus unterstützt Spracheingabe, sodass Sie so natürlich mit TRAE interagieren können wie mit einem menschlichen Teammitglied. Die Ausgabe der KI ist nicht auf Code beschränkt; eine erweiterbare dynamische Ansicht auf der rechten Seite bietet visuelles und intuitives Feedback. - Der Kontext-Ingenieur:
Der SOLO-Modus ist als ultimativer „Kontext-Ingenieur“ konzipiert, der in der Lage ist, den gesamten Umfang Ihrer Arbeit zu verstehen, um sicherzustellen, dass seine Aktionen und Ausgaben auf den umfassendsten und genauesten verfügbaren Informationen basieren.
Zusammenfassend ist das Ziel des TRAE SOLO-Modus, „KI zu ermöglichen, die vollständige Software ausliefert“. Es befähigt Entwickler, durch einen einfachen „Sprechen. Denken. Ausliefern.“-Prozess schneller echte Software zu erstellen und zu veröffentlichen.
Was ist GPT OSS?
GPT-OSS (Open-Source-Serie) ist eine Familie leistungsstarker Open-Weight-Sprachmodelle, die von OpenAI veröffentlicht wurde und für die kommerzielle Nutzung frei verfügbar ist sowie lokal auf Consumer-Hardware ausgeführt werden kann. Die Serie umfasst zwei Hauptmodelle, eine Version mit 20 Milliarden und eine mit 120 Milliarden Parametern, die für starke Schlussfolgerungsfähigkeiten, Tool-Nutzung und Effizienz optimiert sind – dies markiert einen bedeutenden Schritt von OpenAI hin zu größerer Transparenz in der KI-Community. Diese Modelle ermöglichen es Entwicklern und Forschern, sie für benutzerdefinierte Zwecke bei vollständiger Kontrolle über ihre Daten und Infrastruktur fein abzustimmen, und schließen die Lücke zwischen geschlossenen proprietären Systemen und Open-Source-KI.
| Modell | Ebenen | Gesamtparameter | Aktive Parameter pro Token | Gesamtzahl Experten | Aktive Experten pro Token | Kontextlänge | VRAM-Anforderung pro einzelner GPU |
| gpt-oss-120b | 36 | 117B | 5,1B | 128 | 4 | 128k | 80GB |
| gpt-oss-20b | 24 | 21B | 3,6B | 32 | 4 | 128k | 16GB |

Warum GPT OSS für KI-gestützte Programmierung wählen?
Format anpassen: Harmony
GPT‑OSS-Modelle verwenden ein spezielles Gesprächsformat namens Harmony. Dieses Format organisiert Nachrichten in klare Rollen – system, user und assistant – und ermöglicht es Ihnen, zu steuern, wie das Modell denkt und antwortet. Mit Harmony können Sie die Schlussfolgerungstiefe (niedrig, mittel, hoch) anpassen, entscheiden, ob der Denkprozess angezeigt oder ausgeblendet werden soll, und das Modell veranlassen, Funktionen auf stabile, strukturierte Weise aufzurufen. Viele andere Open-Source-Modelle haben diese Steuerungen nicht eingebaut, aber GPT‑OSS versteht sie nativ, da es trainiert wurde, Harmony-Anweisungen zu befolgen. Dies macht es einfacher, konsistente, zuverlässige und toolfreundliche Ausgaben zu erhalten.
Was Harmony steuern kann
Das Harmony-Format ermöglicht es Ihnen, mehrere wichtige Verhaltensparameter für GPT‑OSS-Modelle anzupassen:
| Parameter | Beschreibung | Beispiel |
|---|---|---|
| Schlussfolgerungstiefe | Steuert, wie viel schrittweises Denken das Modell durchführt. | "Reasoning: low", "Reasoning: medium", "Reasoning: high" |
| Funktionsaufruf | Native Unterstützung für JSON-Ausgaben im OpenAI-Stil function_call / tool_calls. |
"Always call function weather_api when asked about weather" |
| Sichtbarkeit der Schlussfolgerung | Zeigen oder Ausblenden der vollständigen Gedankenkette in <think>-Tags. |
"Show reasoning" / "Hide reasoning" |
| Ausgabeformatregeln | Erzwingen strukturierter Ausgaben wie JSON, Markdown usw. | "Output in JSON format" |
Ein Beispiel für eine Harmony-Anfrage
{
"messages": [
{
"role": "system",
"content": "Reasoning: medium; Hide reasoning; Output in JSON format"
},
{
"role": "user",
"content": "Explain how quicksort works."
}
]
}
Vorteile bei der Nutzung von Harmony mit Tools wie Trae
Bei Integration mit Plattformen zur Codegenerierung, Fehlerbehebung und Ausführung wie Trae bietet das Harmony-Format mehrere praktische Vorteile:
- Stabile strukturierte Ausgabe
- Harmony stellt sicher, dass die Ausgabe des Modells einem vorhersagbaren JSON- oder Codeblock-Format folgt.
- Trae kann dies direkt ohne fragile Regex oder Nachbearbeitung parsen.
- Steuerung der Schlussfolgerungstiefe
- Nutzen Sie niedrige Schlussfolgerung für schnelles Prototyping oder einfachen Code.
- Nutzen Sie hohe Schlussfolgerung für komplexe Algorithmen, bei denen Korrektheit am wichtigsten ist.
- Spart GPU/CPU-Ressourcen, indem der Schlussfolgerungsaufwand an die Aufgabenkomplexität angepasst wird.
- Sichtbarkeit der Schlussfolgerung umschalten
- Zeigen Sie
<think>-Schlussfolgerungen zur Fehlerbehebung und zum Lernen an. - Blenden Sie Schlussfolgerungen in der Produktion aus, um Token zu reduzieren und das Durchsickern interner Logik zu vermeiden.
- Zeigen Sie
- Klares Kontextmanagement über mehrere Turns
system-Regeln bleiben über Turns hinweg bestehen und gewährleisten konsistenten Code-Stil und Ausführungsregeln.- Einfaches Iterieren: Passen Sie Benutzeranweisungen an, ohne globale Einstellungen zu verlieren.
- Nahtlose API-Integration
- Harmony ahmt die OpenAI Responses API nach, sodass jede Toolchain oder jedes IDE-Plugin, das mit OpenAI kompatibel ist, mit minimalen Änderungen mit GPT‑OSS funktioniert.
GPT OSS Tool-Nutzung
GPT‑OSS-Modelle sind trainiert, um externe Tools nativ als Teil ihres Schlussfolgerungsprozesses zu nutzen, mit eingebauter Unterstützung für Browsen, Python-Ausführung und Datei-Patching. Diese Tools werden aktiviert, indem sie in der system-Nachricht eines Harmony-formatierten Prompts definiert werden.
1. Browser-Tool
- Zweck: Das Web durchsuchen, Seiten öffnen und Text auf Seiten finden.
- Methoden:
search– Schlüsselphrasen suchen.open– Eine bestimmte Seite öffnen.find– Inhalt auf einer Seite lokalisieren.
- Funktionen:
- Scrollbares Textfenster zur Verwaltung der Kontextgröße.
- Caching für schnellere Wiederbesuche derselben Seite.
- Trainiert, Quellen in Antworten zu zitieren.
- Nutzung: Fügen Sie die Browser-Tool-Definition über
.with_browser()oder.with_tools()imsystem-Prompt hinzu. - Hinweis: Die Referenzimplementierung dient nur zu Bildungszwecken – verwenden Sie in der Produktion Ihr eigenes Backend.
2. Python-Tool
- Zweck: Berechnungen durchführen oder kleine Programme als Teil der Gedankenkette ausführen.
- Funktionen:
- Trainiert mit einem zustandsbehafteten Python-Tool für mehrstufige Schlussfolgerung.
- Die Referenzimplementierung verwendet einen zustandslosen Modus.
- Kann Standard-Tool-Beschreibungen in
openai‑harmonyüberschreiben.
- Nutzung: Fügen Sie es über
.with_python()oder.with_tools()imsystem-Prompt hinzu. - Sicherheitswarnung: Der Referenzcode läuft in einem permissiven Docker-Container – fügen Sie in der Produktion Ihre eigenen Einschränkungen hinzu.
3. Patch-Anwenden-Tool
- Zweck: Lokale Dateien erstellen, aktualisieren oder löschen.
- Anwendungsfall: Code oder Projektdateien als Teil eines automatisierten Entwicklungszyklus ändern.
Wie nutzt man GPT OSS in Trae?
Voraussetzungen: API-Schlüssel abrufen
Novita AI bietet GPT-OSS 120B-APIs mit 131K Kontext und Kosten von $0,1/Eingabe und $0,5/Ausgabe. Novita AI bietet außerdem GPT-OSS 20B mit 131K Kontext und Kosten von $0,05/Eingabe und $0,2/Ausgabe, was eine starke Unterstützung für die Maximierung des Code-Agenten-Potenzials von GPT OSS bietet.
Novita AI
Schritt 1: Einloggen und auf die Modellbibliothek zugreifen
Melden Sie sich bei Ihrem Konto an und klicken Sie auf die Schaltfläche Modellbibliothek.

Probieren Sie GPT OSS jetzt aus!
Schritt 2: Wählen Sie Ihr Modell
Durchstöbern Sie die verfügbaren Optionen und wählen Sie das Modell, das Ihren Anforderungen entspricht.

Schritt 3: Starten Sie Ihre kostenlose Testversion
Starten Sie Ihre kostenlose Testversion, um die Funktionen des ausgewählten Modells zu erkunden.

Schritt 4: Holen Sie sich Ihren API-Schlüssel
Zur Authentifizierung bei der API stellen wir Ihnen einen neuen API-Schlüssel zur Verfügung. Auf der Seite „Einstellungen“ können Sie den API-Schlüssel wie in der Abbildung gezeigt kopieren.

Schritt 5: Installieren Sie die API
Installieren Sie die API über den für Ihre Programmiersprache spezifischen Paketmanager.
Nach der Installation importieren Sie die erforderlichen Bibliotheken in Ihre Entwicklungsumgebung. Initialisieren Sie die API mit Ihrem API-Schlüssel, um mit dem Novita AI LLM zu interagieren. Dies ist ein Beispiel für die Nutzung der Chat-Completions-API für Python-Nutzer.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
GPT‑OSS in TRAE nutzen
Schritt 1: Öffnen Sie Trae und greifen Sie auf Modelle zu
Starten Sie die Trae-App. Klicken Sie auf die Schaltfläche „KI-Seitenleiste umschalten“ in der oberen rechten Ecke, um die KI-Seitenleiste zu öffnen. Gehen Sie dann zu KI-Verwaltung und wählen Sie Modelle.


Schritt 2: Fügen Sie ein benutzerdefiniertes Modell hinzu, wählen Sie Novita als Anbieter und wählen Sie Modelle
Klicken Sie auf die Schaltfläche Modell hinzufügen, um einen benutzerdefinierten Modelleintrag zu erstellen. Wählen Sie im Dialog „Modell hinzufügen“ aus dem Dropdown-Menü Anbieter = Novita.
Wählen Sie aus dem Modell-Dropdown das gewünschte Modell aus (DeepSeek-R1-0528, Kimi K2, GLM 4.5, DeepSeek-V3-0324 oder MiniMax-M1-80k). Wenn das genaue Modell nicht aufgeführt ist, geben Sie einfach die Modell-ID ein, die Sie aus der Novita-Bibliothek notiert haben. Stellen Sie sicher, dass Sie die richtige Variante des Modells auswählen, das Sie verwenden möchten.


Schritt 3: Geben Sie Ihren API-Schlüssel ein
Kopieren Sie den Novita AI API-Schlüssel aus Ihrer Novita-Konsole und fügen Sie ihn in das Feld „API-Schlüssel“ in Trae ein.

Holen Sie sich den Novita AI API-Schlüssel!
Einschränkungen von GPT OSS
| Funktion | GPT-OSS (Selbst gehostetes Modell) | GPT-5 API (Verwaltete Plattform) |
|---|---|---|
| Kernangebot | Ein rohes Modell (der „Motor“) | Eine vollständige, integrierte Plattform (das „Auto“) |
| Modellfähigkeit | Stark, aber eine Generation zurück | State-of-the-Art, Flaggschiff-Schlussfolgerung |
| Eingebaute Tools | Keine. Erfordert großen DIY-Aufwand. | Vollständig verwaltet: Websuche, Dateisuche, Code-Interpreter. |
| Kontextfenster | Praktisch durch Ihre Hardware begrenzt (z. B. 8k-32k) | Massiv (400k), vollständig verwaltet. |
| Agenten-Framework | DIY mit Open-Source-Bibliotheken. Keine Beobachtbarkeit. | Integriertes SDK mit eingebauter Beobachtbarkeit. |
| Unternehmensfunktionen | Keine. Keine Compliance, SSO oder Admin-Steuerungen. | Vollständige Suite: SOC 2, HIPAA, RBAC, SSO usw. |
| Support | Community-basiert und Self-Service. | Engagiertes Account-Team und priorisierter Support. |
| Wartung | Ihre volle Verantwortung. Einrichtung, Skalierung, Betriebszeit. | Null. Wird vollständig von OpenAI übernommen. |
Die Integration von GPT‑OSS mit TRAE vereint das Beste aus beiden Welten:
- GPT‑OSS ist das „Gehirn“, das über das Harmony-Format gesteuert wird, um Schlussfolgerungstiefe anzupassen, Ausgaben zu strukturieren und Denkprozesse ein- oder auszublenden.
- TRAE ist der „Körper“, der einen integrierten Arbeitsbereich, Tool-Verbindungen und autonomes Software-Lebenszyklus-Management bietet – insbesondere im SOLO-Modus.
- Novita AI schließt die Lücke, indem es GPT‑OSS für Sie hostet, sodass Sie es über API ohne teure Hardware nutzen können.
Diese Kombination ermöglicht es Entwicklern, einen benutzerdefinierten „KI-Ingenieur“ zu erstellen, der ihre Anforderungen versteht und diese genau wie beabsichtigt ausführt, was eine wirklich autonome Softwareauslieferung möglich macht.
Häufig gestellte Fragen
Warum GPT‑OSS mit TRAE anstelle eines closed-source-API-Modells verwenden?
Sie erhalten volle Kontrolle. Das Harmony-Format ermöglicht es TRAE, die Schlussfolgerungstiefe, das Ausgabeformat und die Anzeige des Denkprozesses zu steuern. Sie können GPT‑OSS außerdem an Ihren eigenen Code fein abstimmen, um eine perfekte Passform zu erhalten.
Muss ich GPT‑OSS selbst hosten?
Nein. Dienste wie Novita AI hosten es für Sie und geben Ihnen einen API-Schlüssel, sodass Sie keine teuren GPUs oder komplexe Einrichtung benötigen.
Was ist das Harmony-Format und warum ist es wichtig?
Es ist ein spezielles Nachrichtenformat, das GPT‑OSS versteht. Es macht Ausgaben stabil, strukturiert und einfach für TRAE zu verarbeiten – keine fragile Parsing erforderlich.
Novita AI ist die All-in-One-Cloud-Plattform, die Ihre KI-Ambitionen unterstützt. Integrierte APIs, Serverless, GPU-Instanzen – die kostengünstigen Tools, die Sie benötigen. Eliminieren Sie Infrastruktur, starten Sie kostenlos und machen Sie Ihre KI-Vision zur Realität.
Empfohlene Lektüre
Qwen 3 in RAG-Pipelines: All-in-One LLM, Einbettungs- und Reranking-Modelle
Trae oder Claude Code: Welches eignet sich besser für die Nutzung mit Kimi K2?
