在 TRAE 中使用 GPT‑OSS:解鎖 AI 編程的 Harmony 格式

在 TRAE 中使用 GPT‑OSS:解鎖 AI 編程的 Harmony 格式

AI 驅動的軟體開發正快速發展,背後的兩大趨勢是強大的開源模型與 fully integrated 的 AI 開發環境。GPT‑OSS 是 OpenAI 推出的開源權重模型系列,以強大的推理能力、類代理(agent)特性與高度的客製化能力聞名。TRAE 是位元節跳動推出的 AI IDE,設計定位是能獨立建構軟體的完整「AI 工程師」。

那麼問題來了:當 GPT‑OSS 的可控推理能力,遇上 TRAE 豐富的工具整合與自動化開發框架,會產生什麼樣的化學反應?兩者結合能打造出兼具自動化與高度客製化的工作流程,完全符合你的需求。本指南將說明如何將兩者串接,釋放它們的完整潛力。

什麼是 Trae?

TRAE 同時也是位元節跳動開發的 AI 驅動整合開發環境(IDE)的名稱。它被設計為能獨立理解複雜任務、執行並建構軟體解決方案的「AI 工程師」,目標是讓開發者能將任務委派給 AI,簡化開發流程。

trae

Trae 的核心功能

強化工具整合與能力(模型上下文協議 - MCP)

  • 外部工具整合:TRAE 可整合多種外部工具,讓 AI 代理能運用這些工具更高效地完成任務。
  • MCP 支援:它支援模型上下文協議(MCP),這是一個用於連接 AI 應用程式與外部資料來源、工具的開放標準,相當於 AI 的通用「USB-C 連接埠」,解決了 AI 模型與孤立資料連接的難題。
  • 擴展 AI 能力:透過 MCP,代理能存取 Google Drive、Slack、GitHub、資料庫等外部資源,更全面地理解並完成複雜任務。

更深入的上下文理解與精準控制

  • 深度理解開發上下文:TRAE 能深入理解你的開發上下文,包含程式碼儲存庫、線上搜尋結果、共享文件等內容。
  • 精準行為客製化:你可以自訂規則,讓 AI 的行為完全符合你的工作流程,確保任務執行結果與你的預期一致。
  • 多模態互動:支援上傳圖片(例如設計草圖、錯誤截圖)來描述需求,讓 AI 能生成更精準的程式碼。

CUE:智慧預測與一鍵編輯

  • 預測你的下一步編輯:CUE(上下文理解引擎)功能會分析你的編輯行為,理解你的意圖並預測你的下一步操作。
  • 一鍵導航與套用:只要按下 Tab 鍵,就能跳转到下一個建議修改的位置,或是一次性套用跨越多行的智慧建議。
  • 持續優化:該功能持續進行效能與響應速度的優化,為程式碼修改、生成、除錯提供更流暢的體驗。

完整的 IDE 功能與 AI 輔助

  • 雙重開發模式:提供傳統使用者主控的 IDE 模式,以及 AI 從需求分析到交付全程主導開發的 SOLO 模式,實現完全自動化。
  • 功能完整的 IDE:提供程式碼編輯、專案管理、版本控制等標準 IDE 功能。
  • AI 程式設計輔助:提供多種 AI 驅動的輔助功能,包含智慧程式碼補全、重構、聊天問答,以及從自然語言生成專案。
  • 內建網頁預覽:支援在 IDE 內直接預覽網頁,簡化前端開發與除錯流程。

什麼是 Trae Solo?

What is Trae Solo?

  • 統一工作區與 AI 工具中樞
    SOLO 模式會將所有必要的開發工具(IDE、瀏覽器、終端機、文件)直接整合到 AI 中,讓 AI 能根據每個任務的特定需求精準推理與執行,無縫銜接從想法到執行的全流程。
  • AI 主導的端到端開發
    你只需要提供需求,SOLO 就會自動處理完整的開發生命週期,包含:
    • 需求分析
    • 原型製作
    • 前端開發
    • 後端開發
    • 除錯與優化
    • 建置與部署
  • 統一監控視圖
    使用者可以透過單一統一視圖與 AI 聊天,同時監控所有開發活動。「擴展視圖」能詳細查看所有即時執行細節。
  • 多模態互動:「說」出你的需求
    SOLO 模式支援語音輸入,讓你能像與人類隊友互動一樣自然地與 TRAE 溝通。AI 的輸出不侷限於程式碼,右側可展開的動態視圖會提供視覺化、直觀的回饋。
  • 上下文工程師
    SOLO 模式被設計為終極的「上下文工程師」,能全面理解你的工作範疇,確保其所有操作與輸出都基於最完整、最準確的可用資訊。

總結來說,TRAE SOLO 模式的目標是實現「能交付完整軟體的 AI」,透過簡單的「對話、思考、交付」流程,賦予開發者更快建構與發布真實軟體的能力。

什麼是 GPT OSS?

GPT-OSS(開源系列)是 OpenAI 發布的強大開源權重語言模型家族,設計為可免費用於商業用途,並能在消費級硬體上本地運行。該系列包含兩款主力模型:200 億參數版與 1200 億參數版,兩者都針對強大的推理能力、工具使用與效率進行了優化,標誌著 OpenAI 在 AI 社群中邁向更高透明度的重大轉變。這些模型允許開發者與研究人員根據自定義需求進行微調,同時完全掌控自己的資料與基礎設施,填補了封閉專有系統與開源 AI 之間的空白。

模型 層數 總參數數 每 Token 活躍參數數 總專家數 每 Token 活躍專家數 上下文長度 單張 GPU 顯存需求
gpt-oss-120b 36 117B 5.1B 128 4 128k 80GB
gpt-oss-20b 24 21B 3.6B 32 4 128k 16GB

gpt oss benchmark

為什麼選擇 GPT OSS 用於 AI 編程?

客製化格式:Harmony

GPT‑OSS 模型使用一種名為 Harmony 的特殊對話格式。該格式將訊息劃分為清晰的角色:systemuserassistant,讓你能控制模型的思考與回應方式。透過 Harmony,你可以調整推理深度(低、中、高),決定是否顯示或隱藏思考過程,並讓模型以穩定、結構化的方式呼叫函數。許多其他開源模型沒有內建這些控制項,但 GPT‑OSS 原生支援這些功能,因為它在訓練時就學習了遵循 Harmony 指令,因此能更輕鬆地取得一致、可靠且友善工具的輸出。

Harmony 能控制哪些參數

Harmony 格式允許你調整 GPT‑OSS 模型的多項關鍵行為參數:

參數 說明 範例
推理深度 控制模型進行逐步思考的幅度。 "Reasoning: low""Reasoning: medium""Reasoning: high"
函數呼叫 原生支援 OpenAI 風格的 function_call / tool_calls JSON 輸出。 "被問到天氣時, always 呼叫 weather_api 函數"
推理可見性 <think> 標籤中顯示或隱藏完整的思考鏈。 "顯示推理" / "隱藏推理"
輸出格式規則 強制輸出 JSON、Markdown 等結構化格式。 "以 JSON 格式輸出"

Harmony 請求範例

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Explain how quicksort works."
    }
  ]
}

與 Trae 等工具搭配使用 Harmony 的優勢

當與 Trae 等程式碼生成、除錯、執行平台整合時,Harmony 格式能提供多項實用優勢:

  1. 穩定的結構化輸出
    • Harmony 能確保模型的輸出遵循可預測的 JSON 或程式碼區塊格式。
    • Trae 能直接解析此類輸出,無需使用脆弱的正則表達式或後處理。
  2. 推理深度控制
    • 針對快速原型開發或簡單程式碼,使用低階推理。
    • 針對正確性至上的複雜演算法,使用高階推理。
    • 根據任務複雜度匹配推理成本,節省 GPU/CPU 資源。
  3. 切換推理可見性
    • 除錯與學習時,顯示 <think> 推理內容。
    • 生產環境中隱藏推理內容,減少 Token 消耗,避免洩漏內部邏輯。
  4. 清晰的多輪上下文管理
    • system 規則會在多輪對話中持續生效,確保程式碼風格與執行規則一致。
    • 易於迭代:修改使用者指令時不會遺失全域設定。
  5. 無縫 API 整合
    • Harmony 模擬 OpenAI Responses API,因此任何與 OpenAI 相容的工具鏈或 IDE 插件只需少量修改,就能與 GPT‑OSS 協作。

GPT OSS 工具使用

GPT‑OSS 模型在訓練時就原生支援在推理過程中使用外部工具,內建支援瀏覽Python 執行檔案修補功能。這些工具可以透過在 Harmony 格式的提示詞的 system 訊息中定義來啟用。

1. 瀏覽器工具

  • 用途:搜尋網路、開啟網頁、在網頁中尋找文字內容。
  • 方法
    • search:搜尋關鍵字短語。
    • open:開啟特定網頁。
    • find:定位網頁中的特定內容。
  • 特性
    • 可捲動的文字視窗,用於管理上下文大小。
    • 快取機制,加快重複訪問同一頁面的速度。
    • 訓練時學習了在回答中引用來源。
  • 使用方法:在 system 提示詞中透過 .with_browser().with_tools() 加入瀏覽器工具的定義。
  • 注意:參考實現僅供教育用途,生產環境請使用你自己的後端。

2. Python 工具

  • 用途:作為思考鏈的一部分,執行計算或運行小型程式。
  • 特性
    • 訓練時搭配了有狀態的 Python 工具,用於多步驟推理。
    • 參考實現使用無狀態模式。
    • 可覆寫 openai‑harmony 中的預設工具描述。
  • 使用方法:在 system 提示詞中透過 .with_python().with_tools() 加入。
  • 安全警告:參考程式碼在寬鬆的 Docker 容器中運行,生產環境請加入你自己的限制措施。

3. 修補套用工具

  • 用途:建立、更新或刪除本地檔案。
  • 使用場景:作為自動化開發循環的一部分,修改程式碼或專案檔案。

如何在 Trae 中使用 GPT OSS?

前置條件:取得 API 金鑰

Novita AI 提供 GPT-OSS 120B 的 API,擁有 131K 上下文長度,費用為輸入 $0.1/百萬 Token、輸出 $0.5/百萬 Token。同時也提供 GPT-OSS 20B,上下文長度為 131,費用為輸入 $0.05/百萬 Token、輸出 $0.2/百萬 Token,為最大化 GPT OSS 的程式碼代理潛力提供強力支援。

Novita AI

步驟 1:登入並存取模型庫

登入你的帳號,點擊 模型庫 按鈕。

Log In and Access the Model Library

立即試用 GPT OSS!

步驟 2:選擇模型

瀏覽可用的選項,選擇符合你需求的模型。

Step 2: Choose Your Model

步驟 3:開始免費試用

開始免費試用,探索所選模型的能力。

Step 3: Start Your Free Trial

步驟 4:取得 API 金鑰

要進行 API 驗證,我們會提供你新的 API 金鑰。進入「設定」頁面後,即可按照圖片指示複製 API 金鑰。

get api key

取得 Novita AI API 金鑰!

步驟 5:安裝 API

使用對應程式語言的套件管理器安裝 API。

安裝完成後,將必要的函式庫匯入你的開發環境,使用 API 金鑰初始化 API,即可開始與 Novita AI LLM 互動。以下是为 Python 使用者提供的聊天完成 API 使用範例:

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

在 TRAE 中使用 GPT‑OSS

步驟 1:開啟 Trae 並存取模型

啟動 Trae 應用程式,點擊右上角的「切換 AI 側邊欄」按鈕開啟 AI 側邊欄,接著進入 AI 管理 並選擇 模型

Toggle AI Side Bar

go to AI Management and select Models

步驟 2:新增自訂模型,選擇 Novita 作為供應商並選取模型

點擊 新增模型 按鈕建立自訂模型條目,在新增模型對話框中,從下拉選單選擇 供應商 = Novita

從模型下拉選單中挑選你想要的模型(DeepSeek-R1-0528、Kimi K2、GLM 4.5、DeepSeek-V3-0324 或 MiniMax-M1-80k)。如果找不到對應的模型,直接輸入你從 Novita 模型庫中記下的模型 ID 即可,確保選擇你要使用的正確模型變體。

Add a Custom Model

Choose Novita as Prov

步驟 3:輸入 API 金鑰

從你的 Novita 控制台複製 Novita AI API 金鑰,貼到 Trae 的 API 金鑰欄位中。

get api key

GPT OSS 的限制

功能 GPT-OSS(自主託管模型) GPT-5 API(受管平台)
核心產品 原始模型(「引擎」) 完整的整合平台(「整車」)
模型能力 能力強勁,但落後一代 最先進的旗艦級推理能力
內建工具 。需要大量的自行開發(DIY)工作量。 完全受管:網路搜尋、檔案搜尋、程式碼直譯器。
上下文視窗 實際上線取決於你的硬體(例如 8k-32k) 超大(400k),完全受管。
代理框架 使用開源函式庫自行搭建,無可觀測性。 整合 SDK,內建可觀測性。
企業功能 。無合規、SSO 或管理員控制功能。 完整套件:SOC 2、HIPAA、RBAC、SSO 等。
支援 社群基礎、自助服務。 專屬帳號團隊與優先支援。
維護 完全由你負責。包含設定、擴展、正常運行時間。 零負擔。完全由 OpenAI 處理。

將 GPT‑OSS 與 TRAE 整合,能兼得兩者優點:

  • GPT‑OSS 是「大腦」,透過 Harmony 格式控制推理深度、結構化輸出,以及隱藏或顯示思考過程。
  • TRAE 是「軀體」,提供整合工作區、工具連接與自主軟體生命週期管理功能,尤其在 SOLO 模式下表現突出。
  • Novita AI 填補了兩者之間的空白,為你託管 GPT‑OSS,讓你能透過 API 使用,无需昂貴的硬體。

這種組合讓開發者能打造客製化的「AI 工程師」,它既能理解需求,也能完全按照預期執行任務,實現真正的自主軟體交付。

常見問題

為什麼要搭配 TRAE 使用 GPT‑OSS,而不是封閉源碼的 API 模型?

你能獲得完全的控制權。Harmony 格式讓 TRAE 能控制推理深度、輸出格式,以及是否顯示思考過程。你也可以在自己的程式碼上微調 GPT‑OSS,達到完美契合。

我需要自行託管 GPT‑OSS 嗎?

不需要。像 Novita AI 這類服務會為你託管模型並提供 API 金鑰,你无需昂貴的 GPU 或複雜的設定。

什麼是 Harmony 格式?為什麼它很重要?

這是 GPT‑OSS 能理解的特殊訊息格式,能讓輸出穩定、結構化,且易於 TRAE 處理,无需脆弱的解析邏輯。

Novita AI 是能實現你 AI 抱負的一站式雲端平台。整合 API、無伺服器、GPU 實例——都是你需要的低成本工具。免除基礎設施煩惱,免費開始,將你的 AI 願景化為現實。

推薦閱讀

Qwen 3 在 RAG 流程中的應用:一站式 LLM、嵌入與重排序模型

Trae 還是 Claude Code:哪個更適合搭配 Kimi K2 使用?

DeepSeek R1 0528 成本比較:API、GPU、本地部署