在TRAE中使用GPT‑OSS：解鎖Harmony格式進行AI程式開發

什麼是 Trae？
什麼是 GPT OSS？
為什麼選擇 GPT OSS 進行 AI 程式開發？
如何在 Trae 中使用 GPT OSS？
GPT OSS 的限制

AI 驅動的軟體開發正快速發展，驅動力來自兩大趨勢：強大的開源模型以及完全整合的 AI 開發環境。GPT‑OSS 是 OpenAI 開放的權重模型系列，以其強大的推理能力、類代理功能以及深度客製化著稱。TRAE 是字節跳動推出的 AI IDE，旨在扮演完整的「AI 工程師」，能夠自主建構軟體。

問題是：當你將 GPT‑OSS 可控的推理能力與 TRAE 豐富工具、自動化的開發框架結合時，會發生什麼事？兩者共同打造出既自動化又完全符合你需求的工作流程。本指南將說明如何串接它們，並釋放其全部潛力。

什麼是 Trae？

TRAE 也是字節跳動所建立的 AI 驅動整合開發環境（IDE）名稱。它被設計成一個「AI 工程師」，能夠理解複雜任務並自主執行，從而建構軟體解決方案。TRAE 旨在簡化開發工作流程，讓使用者將任務委派給 AI。

Trae 的主要功能

增強的工具整合與能力（模型上下文協議 - MCP）

外部工具整合：TRAE 整合了多種外部工具，讓 AI 代理能夠使用它們更有效地執行任務。
MCP 支援：支援模型上下文協議（MCP），這是一種開放標準，用於將 AI 應用程式連接到外部資料來源和工具。它就像 AI 的通用「USB-C」埠，解決了將 AI 模型連接到孤立資料的挑戰。
擴展 AI 能力：透過 MCP，代理可以存取外部資源，例如 Google Drive、Slack、GitHub 和資料庫，以更好地理解並完成複雜任務。

更深的情境理解與精確控制

深入理解開發情境：TRAE 深入理解你的開發情境，包括程式碼倉庫、線上搜尋結果以及共享文件。
精確的行為自訂：你可以自訂規則，將 AI 的行為調整到符合你的工作流程，確保它完全按照你的意圖執行任務。
多模態互動：支援上傳圖片（例如設計稿、錯誤截圖）來輔助描述需求，讓 AI 產生更準確的程式碼。

CUE：智慧預測與一鍵編輯

預測你的下一步編輯：CUE（情境理解引擎）功能透過分析你的編輯行為，理解你的意圖並預測你的下一步動作。
一鍵導航與套用：只需按下 Tab 鍵，即可跳至下一個建議的修改，或一次將智慧建議套用至多行。
持續最佳化：該功能持續最佳化以獲得更好的效能和回應速度，為程式碼修改、產生和除錯提供更流暢的體驗。

全面的 IDE 功能與 AI 輔助

雙重開發模式：提供 IDE 模式（傳統的使用者主導工作流程）以及 SOLO 模式（AI 從需求到交付主導開發，實現完全自動化）。
功能完整的 IDE：提供標準 IDE 功能，例如程式碼編輯、專案管理以及版本控制。
AI 程式設計輔助：提供多種 AI 驅動的輔助功能，包括智慧程式碼補全、重構、基於聊天的問答以及從自然語言產生專案。
內建網頁預覽：支援直接在 IDE 中預覽網頁，讓前端開發和除錯更輕鬆。

什麼是 Trae Solo？

統一工作區與 AI 工具中心：
SOLO 模式將所有必要的開發工具——IDE、瀏覽器、終端機和文件——直接整合到 AI 中。這使得 AI 能夠根據每個任務的特定需求精確推理和行動，無縫銜接從想法到執行的過程。
AI 主導的端到端開發：
你只需提供需求，SOLO 便會自主處理整個開發生命週期，包括：
- 需求分析
- 原型製作
- 前端開發
- 後端開發
- 除錯與最佳化
- 建置與部署
統一監控視圖：
使用者可以與 AI 聊天，並從單一統一視圖監控所有開發活動。「擴展視圖」提供所有即時執行細節的詳細檢視。
多模態互動：「說出」你的需求：
SOLO 模式支援語音輸入，讓你可以像與人類隊友互動一樣自然地與 TRAE 互動。AI 的輸出不僅限於程式碼；右側可展開的動態視圖提供視覺化且直觀的回饋。
情境工程師：
SOLO 模式被設計為終極的「情境工程師」，能夠理解你工作的完整範疇，確保其行動和輸出基於最全面且準確的可用資訊。

總而言之，TRAE SOLO 模式的目標是實現「能夠交付完整軟體的 AI」。它透過簡單的「對話。思考。交付。」流程，讓開發者能夠更快地建置和發布真實的軟體。

什麼是 GPT OSS？

GPT-OSS（開源系列）是 OpenAI 發布的一系列強大、開放權重的語言模型，設計用於商業用途，且可以在消費級硬體上本機運行。該系列包括兩個主要模型，分別為 200 億和 1200 億參數版本，針對強大的推理、工具使用和效率進行了最佳化，這標誌著 OpenAI 在 AI 社群中朝向更大透明度邁出了重要一步。這些模型允許開發者和研究人員為客製化目的進行微調，並完全控制其資料和基礎設施，從而縮小了封閉、專有系統與開源 AI 之間的差距。


模型	層數	總參數	每個 Token 的活躍參數	專家總數	每個 Token 的活躍專家數	上下文長度	單 GPU VRAM 需求
gpt-oss-120b	36	117B	5.1B	128	4	128k	80GB
gpt-oss-20b	24	21B	3.6B	32	4	128k	16GB

為什麼選擇 GPT OSS 進行 AI 程式開發？

客製化格式：Harmony

GPT‑OSS 模型使用一種特殊的對話格式，稱為 Harmony。這種格式將訊息組織成明確的角色 — system、user 和 assistant，並讓你能控制模型的思考與回應方式。使用 Harmony，你可以調整推理深度（低、中、高）、決定是否顯示或隱藏思考過程，以及讓模型以穩定、結構化的方式呼叫函式。許多其他開源模型沒有內建這些控制項，但 GPT‑OSS 因為經過 Harmony 指令的訓練，所以能夠原生理解它們。這使得更容易獲得一致、可靠且對工具友善的輸出。

Harmony 可以控制什麼

Harmony 格式讓你可以調整 GPT‑OSS 模型的幾個關鍵行為參數：

參數	說明	範例
推理深度	控制模型進行逐步思考的程度。	`"Reasoning: low"`、`"Reasoning: medium"`、`"Reasoning: high"`
函式呼叫	原生支援 OpenAI 風格的 `function_call` / `tool_calls` JSON 輸出。	`"Always call function weather_api when asked about weather"`
推理可見性	在 `thinking` 標籤中顯示或隱藏完整的思考鏈。	`"Show reasoning"` / `"Hide reasoning"`
輸出格式規則	強制輸出結構化格式，例如 JSON、Markdown 等。	`"Output in JSON format"`

一個 Harmony 請求範例

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Explain how quicksort works."
    }
  ]
}

在 Trae 等工具中使用 Harmony 的好處

當與程式碼生成、除錯和執行平台（例如 Trae）整合時，Harmony 格式提供了幾個實用優勢：

穩定的結構化輸出
- Harmony 確保模型的輸出遵循可預測的 JSON 或程式碼區塊格式。
- Trae 可以直接解析，無需脆弱的正規表示式或後處理。
推理深度控制
- 對快速原型或簡單程式碼使用低推理。
- 對複雜演算法（正確性最重要）使用高推理。
- 透過將推理成本與任務複雜度匹配，節省 GPU/CPU 資源。
切換推理可見性
- 顯示 thinking 推理以進行除錯和學習。
- 在生產環境中隱藏推理以減少 Token 用量，並避免洩漏內部邏輯。
清晰的多輪對話上下文管理
- system 規則在輪次之間持續生效，確保一致的程式碼風格和執行規則。
- 易於迭代：修改使用者指令而不會遺失全域設定。
無縫 API 整合
- Harmony 模仿 OpenAI Responses API，因此任何與 OpenAI 相容的工具鏈或 IDE 外掛程式，都可以在極少修改的情況下與 GPT‑OSS 協作。

GPT OSS 工具使用

GPT‑OSS 模型經過訓練，能夠在推理過程中原生使用外部工具，內建支援 **瀏覽 **、**Python 執行 ** 和 ** 檔案修補 **。這些工具透過在 Harmony 格式 的 system 訊息中定義來啟用。

1. 瀏覽器工具

目的： 搜尋網路、開啟頁面以及尋找頁面上的文字。
方法：
- search — 搜尋關鍵詞。
- open — 開啟特定頁面。
- find — 定位頁面上的內容。
特性：
- 可滾動的文字視窗，用於管理上下文大小。
- 快取功能，可更快地重新造訪同一頁面。
- 經過訓練，能夠在答案中引用來源。
用法： 透過在 system 提示中使用 .with_browser() 或 .with_tools() 來新增瀏覽器工具定義。
注意： 參考實作僅供教育用途 — 在生產環境中請使用你自己的後端。

2. Python 工具

目的： 在思考鏈中執行計算或執行小型程式。
特性：
- 使用有狀態的 Python 工具進行多步驟推理訓練。
- 參考實作使用 無狀態 模式。
- 可以在 openai‑harmony 中覆蓋預設工具描述。
用法： 透過在 system 提示中使用 .with_python() 或 .with_tools() 來新增。
安全警告： 參考程式碼在寬鬆的 Docker 容器中運行 — 在生產環境中請自行添加限制。

3. 套用修補工具

目的： 建立、更新或刪除本機檔案。
使用案例： 在自動化開發循環中修改程式碼或專案檔案。

如何在 Trae 中使用 GPT OSS？

先決條件：取得 API 金鑰

Novita AI 提供 GPT-OSS 120B
API，具有 **131K 上下文 **，費用為 **$0.1/輸入 ** 和 **$0.5/輸出 **。Novita AI 也提供 GPT-OSS 20B，具有 131K 上下文，費用為 **$0.05/輸入 ** 和 $0.2/輸出，為最大化 GPT OSS 程式碼代理潛力提供強大支援。

Novita AI

步驟 1：登入並存取模型庫

登入你的帳戶，然後點擊 Model Library 按鈕。

立即試用 GPT OSS！

步驟 2：選擇你的模型

瀏覽可用的選項，然後選擇適合你需求的模型。

步驟 3：開始免費試用

開始免費試用，探索所選模型的能力。

步驟 4：取得你的 API 金鑰

為了通過 API 進行驗證，我們會提供一個新的 API 金鑰。進入 Settings 頁面，你可以按照圖片所示複製 API 金鑰。

步驟 5：安裝 API

使用你程式語言特定的套件管理工具安裝 API。

安裝後，將必要的函式庫匯入你的開發環境。使用你的 API 金鑰初始化 API，開始與 Novita AI LLM 互動。這是 Python 使用者使用聊天補全 API 的範例。

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

在 TRAE 中使用 GPT‑OSS

步驟 1：開啟 Trae 並存取模型

啟動 Trae 應用程式。點擊右上角的 Toggle AI Side Bar，開啟 AI Side Bar。然後，前往 AI Management 並選擇 Models。

步驟 2：新增自訂模型，選擇 Novita 作為提供者並選擇模型

點擊 Add Model 按鈕，建立一個自訂模型條目。在新增模型對話框中，從下拉選單中選擇 Provider = Novita。

從 Model 下拉選單中，選取你想要的模型（DeepSeek-R1-0528、Kimi K2、GLM 4.5、DeepSeek-V3-0324 或 MiniMax-M1-80k）。如果確切的模型沒有列出，只需輸入你從 Novita 庫中記下的模型 ID。確保你選擇了想要使用之模型的正確變體。

步驟 3：輸入你的 API 金鑰

從你的 Novita 控制台複製 Novita AI API 金鑰，並將其貼上到 Trae 的 API Key 欄位中。

取得 Novita AI API 金鑰！

GPT OSS 的限制

功能	GPT-OSS（自託管模型）	GPT-5 API（管理平台）
核心產品	原始模型（「引擎」）	完整的整合平台（「汽車」）
模型能力	強大，但落後一代	最先進的旗艦推理
內建工具	無。需要大量的 DIY 工作。	完全管理：網頁搜尋、檔案搜尋、程式碼解釋器。
上下文視窗	實際上受你的硬體限制（例如 8k-32k）	巨大（400k），完全管理。
代理框架	使用開源函式庫 DIY。無可觀測性。	整合 SDK 並內建可觀測性。
企業功能	無。沒有合規性、SSO 或管理控制。	完整套件： SOC 2、HIPAA、RBAC、SSO 等。
支援	社群驅動且自助服務。	專屬客戶團隊與優先支援。
維護	你的全責。設定、擴展、正常運行時間。	零。完全由 OpenAI 處理。

將 GPT‑OSS 與 TRAE 整合，帶來了兩全其美的效果：

GPT‑OSS 是「大腦」，透過 Harmony 格式 控制，以調整推理深度、結構化輸出，以及隱藏或顯示思考過程。
TRAE 是「身體」，提供整合的工作區、工具連接以及自主的軟體生命週期管理，特別是在 SOLO 模式中。
Novita AI 彌合了差距，為你託管 GPT‑OSS，讓你無需昂貴的硬體即可透過 API 使用它。

這種組合讓開發者能夠建立一個客製化的「AI 工程師」，它能夠理解你的需求並完全按照意圖執行，使真正自主的軟體交付成為可能。

常見問題

為什麼要在 TRAE 中使用 GPT‑OSS 而不是封閉原始碼的 API 模型？

你獲得完全的控制權。Harmony 格式讓 TRAE 能夠控制推理深度、輸出格式，以及是否顯示思考過程。你還可以在自己的程式碼上微調 GPT‑OSS，以達到完美契合。

我需要自己託管 GPT‑OSS 嗎？

不需要。像 Novita AI 這樣的服務會為你託管它，並提供 API 金鑰，因此你不需要昂貴的 GPU 或複雜的設定。

什麼是 Harmony 格式，為什麼它很重要？

它是 GPT‑OSS 理解的一種特殊訊息格式。它使輸出穩定、結構化，且易於 TRAE 處理——無需脆弱的解析。

Novita AI 是一個一站式雲端平台，賦能你的 AI 抱負。整合 API、無伺服器、GPU 實例——你所需的成本效益工具。消除基礎設施，免費開始，讓你的 AI 願景成真。

在TRAE中使用GPT‑OSS：解鎖Harmony格式進行AI程式開發

什麼是 Trae？

Trae 的主要功能

什麼是 Trae Solo？

什麼是 GPT OSS？

為什麼選擇 GPT OSS 進行 AI 程式開發？

客製化格式：Harmony

Harmony 可以控制什麼

在 Trae 等工具中使用 Harmony 的好處

GPT OSS 工具使用

如何在 Trae 中使用 GPT OSS？

先決條件：取得 API 金鑰

在 TRAE 中使用 GPT‑OSS

GPT OSS 的限制

常見問題

推薦閱讀

Product

RESOURCES

Partners

Company

什麼是 Trae？

Trae 的主要功能

什麼是 Trae Solo？

什麼是 GPT OSS？

為什麼選擇 GPT OSS 進行 AI 程式開發？

客製化格式：Harmony

Harmony 可以控制什麼

在 Trae 等工具中使用 Harmony 的好處

GPT OSS 工具使用

如何在 Trae 中使用 GPT OSS？

先決條件：取得 API 金鑰

在 TRAE 中使用 GPT‑OSS

GPT OSS 的限制

常見問題

推薦閱讀

相關文章

Product

RESOURCES

Partners

Company