在Trae中使用GPT-OSS:解锁AI编程的Harmony格式

在Trae中使用GPT-OSS:解锁AI编程的Harmony格式

AI驱动的软件开发正在快速发展,背后有两大核心趋势:强大的开源模型和高度集成的AI开发环境。GPT‑OSS 是OpenAI推出的开源权重模型系列,以强大的推理能力、类智能体特性和深度可定制性著称。TRAE 是字节跳动推出的AI IDE,旨在充当能够独立构建软件的完整“AI工程师”。

那么问题来了:如果将GPT‑OSS的可控推理能力与TRAE工具丰富、自动化的开发框架结合,会碰撞出怎样的火花?二者结合将打造出既自动化又能精准适配你需求的工作流。本指南将讲解如何将二者对接,释放它们的全部潜力。

什么是Trae?

TRAE 也是字节跳动推出的AI驱动集成开发环境(IDE)的名称。它被设计为“AI工程师”,能够理解复杂任务并自主执行,独立构建软件解决方案。TRAE的目标是通过允许用户将任务委托给AI,简化开发工作流。

trae

Trae的核心功能

增强的工具集成与能力(模型上下文协议 - MCP)

  • 外部工具集成:TRAE集成了多种外部工具,使AI智能体能够调用这些工具更高效地执行任务。
  • MCP支持:它支持模型上下文协议(MCP),这是一项用于连接AI应用与外部数据源、工具的开源标准。它相当于AI的通用“USB-C”接口,解决了AI模型与孤立数据连接的难题。
  • 扩展的AI能力:通过MCP,智能体可以访问Google Drive、Slack、GitHub和数据库等外部资源,更好地理解并完成复杂任务。

更深入的上下文理解与精准控制

  • 深度理解开发上下文:TRAE能够深度理解你的开发上下文,包括代码仓库、在线搜索结果和共享文档。
  • 精准的行为定制:你可以自定义规则,让AI的行为适配你的工作流,确保它完全按照你的预期执行任务。
  • 多模态交互:支持上传图片(如设计稿、错误截图)辅助描述需求,让AI生成更准确的代码。

CUE:智能预测与一键编辑

  • 预测你的下一步编辑:CUE(上下文理解引擎)功能会理解你的意图,通过分析你的编辑行为预测你的下一步操作。
  • 一键导航与应用:只需按下Tab键,即可跳转到下一个建议修改的位置,或一次性应用多行智能建议。
  • 持续优化:该功能会持续迭代优化性能和响应速度,为代码修改、生成和bug修复提供更流畅的体验。

全面的IDE功能与AI辅助

  • 双开发模式:提供IDE模式(传统的用户可控工作流)和SOLO模式(AI从需求到交付全流程主导开发,实现完全自动化)。
  • 全功能IDE:提供代码编辑、项目管理、版本控制等标准IDE功能。
  • AI编程辅助:提供多种AI驱动的辅助功能,包括智能代码补全、代码重构、聊天式问答,以及通过自然语言生成项目。
  • 内置网页预览:支持在IDE内直接预览网页,简化前端开发和调试流程。

什么是Trae Solo?

What is Trae Solo?

  • 统一工作空间与AI工具中枢
    SOLO模式将IDE、浏览器、终端、文档等所有必要的开发工具直接集成到AI中,使AI能够基于每个任务的具体需求精准推理和行动,无缝衔接从想法到落地的全流程。
  • AI主导的端到端开发
    你只需提供需求,SOLO即可自主处理完整的开发生命周期,包括:
    • 需求分析
    • 原型设计
    • 前端开发
    • 后端开发
    • 调试优化
    • 构建部署
  • 统一监控视图
    用户可以在单一的统一视图中与AI对话,同时监控所有开发活动。“扩展视图”可以查看所有实时执行的详细信息。
  • 多模态交互:“说出”你的需求
    SOLO模式支持语音输入,你可以像和人类队友交流一样自然地与TRAE交互。AI的输出不限于代码,右侧可展开的动态视图会提供直观的可视化反馈。
  • 上下文工程师
    SOLO模式被设计为终极“上下文工程师”,能够理解你工作的全貌,确保其行为和输出基于最全面、最准确的信息。

总而言之,TRAE SOLO模式的目标是实现“能交付完整软件的AI”。它通过简单的“对话、思考、交付”流程,赋能开发者更快地构建和发布真实可用的软件。

什么是GPT OSS?

GPT-OSS(开源系列)是OpenAI发布的一系列强大的开源权重语言模型,可免费用于商业用途,也可在消费级硬件上本地运行。该系列包含两款主力模型:200亿参数版本和1200亿参数版本,均针对强推理、工具调用和高效能进行了优化,标志着OpenAI在AI社区向更高透明度迈出了重要一步。开发者和研究人员可以对这些模型进行微调,用于自定义场景,完全掌控自身数据和基础设施,弥合闭源专有系统与开源AI之间的鸿沟。

Model Layers Total Params Active Params Per Token Total Experts Active Experts Per Token Context Length Single GPU VRAM Requirement
gpt-oss-120b 36 117B 5.1B 128 4 128k 80GB
gpt-oss-20b 24 21B 3.6B 32 4 128k 16GB

gpt oss benchmark

为什么选择GPT OSS用于AI编程?

自定义格式:Harmony

GPT‑OSS模型使用一种名为Harmony的特殊对话格式。该格式将消息划分为清晰的systemuserassistant角色,允许你控制模型的思考与响应方式。通过Harmony,你可以调整推理深度(低、中、高),决定是否展示思考过程,还能让模型以稳定、结构化的方式调用函数。许多其他开源模型没有内置这些控制功能,但GPT‑OSS原生支持这些指令,因为它是在训练阶段就学习遵循Harmony指令的。这使得你更容易获得一致、可靠、且适配工具调用的输出。

Harmony可控制的参数

Harmony格式允许你调整GPT‑OSS模型的多项核心行为参数:

Parameter Description Example
Reasoning Depth 控制模型执行逐步思考的深度。 "Reasoning: low""Reasoning: medium""Reasoning: high"
Function Calling 原生支持OpenAI风格的function_call/tool_calls JSON格式输出。 "被问及天气时始终调用weather_api函数"
Reasoning Visibility <think>标签中展示或隐藏完整的思维链。 "Show reasoning" / "Hide reasoning"
Output Format Rules 强制输出JSON、Markdown等结构化格式。 "以JSON格式输出"

Harmony请求示例

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Explain how quicksort works."
    }
  ]
}

将Harmony与Trae等工具结合使用的优势

当与Trae等代码生成、调试、执行平台集成时,Harmony格式具备多项实用优势:

  1. 稳定的结构化输出
    • Harmony可确保模型输出遵循可预测的JSON或代码块格式。
    • Trae可以直接解析这类输出,无需脆弱的正则匹配或后处理。
  2. 推理深度可控
    • 简单代码或快速原型开发时使用推理模式。
    • 对正确性要求高的复杂算法使用推理模式。
    • 通过匹配推理成本与任务复杂度,节省GPU/CPU资源。
  3. 推理可见性切换
    • 调试和学习场景下展示<think>中的推理过程。
    • 生产环境隐藏推理过程,减少token消耗,避免泄露内部逻辑。
  4. 清晰的多轮上下文管理
    • system规则在多轮对话中持续生效,确保代码风格和执行规则一致。
    • 迭代便捷:修改用户指令时不会丢失全局设置。
  5. 无缝API集成
    • Harmony兼容OpenAI Responses API,因此任何与OpenAI兼容的工具链或IDE插件只需少量修改即可与GPT‑OSS适配。

GPT OSS的工具调用

GPT‑OSS模型在训练阶段就原生支持将外部工具作为推理过程的一部分,内置支持网页浏览Python执行文件补丁三类工具。只需在Harmony格式的提示词的system消息中定义这些工具,即可激活它们。

1. 网页浏览工具

  • 用途:搜索网页、打开页面、在页面中查找文本。
  • 调用方法
    • search — 搜索关键词短语。
    • open — 打开指定页面。
    • find — 定位页面中的内容。
  • 特性
    • 可滚动的文本窗口,用于管理上下文大小。
    • 缓存机制,加快同一页面的重复访问速度。
    • 训练时已学习在回答中标注来源。
  • 使用方法:在system提示词中通过.with_browser().with_tools()添加网页浏览工具的定义。
  • 注意:参考实现仅用于教育目的,生产环境请使用你自己的后端服务。

2. Python执行工具

  • 用途:执行计算或运行小型程序,作为思维链的一部分。
  • 特性
    • 训练时使用了支持状态的Python工具,可用于多步推理。
    • 参考实现采用无状态模式。
    • 可覆盖openai-harmony中的默认工具描述。
  • 使用方法:在system提示词中通过.with_python().with_tools()添加该工具。
  • 安全警告:参考代码在宽松的Docker容器中运行,生产环境请自行添加安全限制。

3. 文件补丁工具

  • 用途:创建、更新或删除本地文件。
  • 适用场景:在自动化开发循环中修改代码或项目文件。

如何在Trae中使用GPT OSS?

前置条件:获取API密钥

Novita AI提供GPT-OSS 120B的API,支持131K上下文,输入价格为**$0.1/次**,输出价格为**$0.5/次**。Novita AI还提供GPT-OSS 20B的API,支持131K上下文,输入价格为**$0.05/次**,输出价格为**$0.2/次**,为最大化GPT OSS的代码智能体潜力提供强力支持。

Novita AI

步骤1:登录并访问模型库

登录你的账号,点击模型库按钮。

Log In and Access the Model Library

立即试用GPT OSS!

步骤2:选择模型

浏览可用选项,选择适合你需求的模型。

Step 2: Choose Your Model

步骤3:开启免费试用

开启免费试用,探索所选模型的能力。

Step 3: Start Your Free Trial

步骤4:获取API密钥

为了完成API身份验证,我们会为你生成新的API密钥。进入“设置”页面,即可按照图中指示复制API密钥。

get api key

步骤5:安装API SDK

使用你所用编程语言的包管理器安装API SDK。

安装完成后,将必要的库导入你的开发环境,使用API密钥初始化API,即可开始调用Novita AI的LLM服务。以下是Python用户调用聊天补全API的示例:

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

在TRAE中使用GPT‑OSS

步骤1:打开Trae并进入模型设置

启动Trae应用。点击右上角的“切换AI侧边栏”按钮打开AI侧边栏,然后进入AI管理,选择模型选项。

Toggle AI Side Bar

go to AI Management and select Models

步骤2:添加自定义模型,选择Novita作为服务商并选择模型

点击添加模型按钮创建自定义模型条目。在添加模型的对话框中,从下拉菜单选择服务商 = Novita

在模型下拉菜单中选择你需要的模型(DeepSeek-R1-0528、Kimi K2、GLM 4.5、DeepSeek-V3-0324或MiniMax-M1-80k)。如果列表中没有你需要的模型,直接输入你在Novita模型库中记录的模型ID即可,确保选择你想要的正确模型版本。

Add a Custom Model

Choose Novita as Prov

步骤3:输入API密钥

复制你在Novita控制台获取的Novita AI API密钥,粘贴到Trae的API密钥输入框中。

get api key

获取Novita AI API密钥!

GPT OSS的局限性

特性 GPT-OSS(自托管模型) GPT-5 API(托管平台)
核心产品 原始模型(相当于“引擎”) 完整的集成平台(相当于“整车”)
模型能力 能力强劲,但落后一代 最先进的旗舰级推理能力
内置工具 。需要大量自行开发工作。 全托管:网页搜索、文件搜索、代码解释器。
上下文窗口 实际受你的硬件限制(例如8k-32k) 超大(400k),全托管。
智能体框架 使用开源库自行搭建,无可观测性。 集成SDK,内置可观测性功能。
企业级特性 。无合规、SSO或管理员控制功能。 全功能套件:SOC 2、HIPAA、RBAC、SSO等。
支持服务 基于社区的自助服务。 专属客户经理与优先支持。
维护责任 完全由你承担。包括搭建、扩容、运维。 零负担。完全由OpenAI负责。

将GPT‑OSS与TRAE结合,可以兼顾两者优势:

  • GPT‑OSS 是“大脑”,通过Harmony格式控制,可调整推理深度、结构化输出,以及隐藏或展示思考过程。
  • TRAE 是“身体”,提供集成工作空间、工具连接和自主软件生命周期管理,在SOLO模式下表现尤为突出。
  • Novita AI 填补了鸿沟,为你托管GPT‑OSS,让你无需昂贵硬件即可通过API使用它。

这种组合让开发者可以打造定制化的“AI工程师”,它能够理解需求并完全按照预期执行,实现真正的自主软件交付。

常见问题

为什么选择GPT‑OSS+TRAE,而不是闭源API模型?

你可以获得完全控制权。Harmony格式允许TRAE控制推理深度、输出格式,以及是否展示思考过程。你还可以用自己的代码微调GPT‑OSS,实现完美适配。

我需要自己托管GPT‑OSS吗?

不需要。Novita AI 这类服务会为你托管模型并提供API密钥,你无需购买昂贵的GPU,也无需进行复杂配置。

什么是Harmony格式,它为什么重要?

它是GPT‑OSS原生支持的特殊消息格式。它让输出更稳定、结构化,易于TRAE处理,无需脆弱的解析逻辑。

Novita AI 是助力你实现AI愿景的一站式云平台。集成API、无服务器、GPU实例——你需要的低成本工具都在这里。无需操心基础设施,免费即可开始,让你的AI想法落地成真。

推荐阅读

Qwen 3在RAG pipelines中的应用:一体化LLM、嵌入与重排序模型方案

Trae还是Claude Code:哪个更适合搭配Kimi K2使用?

DeepSeek R1 0528成本对比:API、GPU、本地部署