在 TRAE 中使用 GPT‑OSS：解锁适合 AI 编码的 Harmony 格式

什么是 Trae？
什么是 GPT OSS？
为什么选择 GPT OSS 进行 AI 编码？
如何在 Trae 中使用 GPT OSS？
GPT OSS 的限制

AI 驱动的软件开发正在快速发展，两大趋势推动着这一进程：强大的开源模型和全面集成的 AI 开发环境。GPT‑OSS 是 OpenAI 的开源权重模型系列，以强大的推理、类似智能体的能力和深度定制著称。TRAE 来自字节跳动，是一个 AI IDE，旨在充当能够独立构建软件的“AI 工程师”。

问题是：当将 GPT‑OSS 可控的推理能力与 TRAE 丰富工具、自动化的开发框架相结合时，会发生什么？它们共同创造了一个既自动化又能根据你的确切需求定制的工作流。本指南将解释如何将它们连接起来，并发挥它们的全部潜力。

什么是 Trae？

TRAE 也是字节跳动开发的一个 AI 驱动的集成开发环境 (IDE) 的名称。它旨在作为一个“AI 工程师”运行，能够通过理解复杂任务并执行它们来独立构建软件解决方案。TRAE 旨在通过允许用户将任务委托给 AI 来简化开发工作流。

Trae 的关键功能

增强的工具集成与能力（模型上下文协议 - MCP）

外部工具集成：TRAE 与各种外部工具集成，使 AI 智能体能够使用这些工具更有效地执行任务。
MCP 支持：它支持模型上下文协议 (MCP)，这是一个用于连接 AI 应用与外部数据源和工具的开放标准。这就像 AI 的通用“USB-C”端口，解决了将 AI 模型与孤立数据连接起来的难题。
扩展的 AI 能力：通过 MCP，智能体可以访问外部资源，如 Google Drive、Slack、GitHub 和数据库，以更好地理解和完成复杂的任务。

更深层的上下文理解与精确控制

深度理解开发上下文：TRAE 深度理解你的开发上下文，包括代码仓库、在线搜索结果和共享文档。
精确的行为定制：你可以自定义规则，使 AI 的行为符合你的工作流，确保它完全按照你的意图执行任务。
多模态交互：支持图片上传（例如设计稿、错误截图）来描述需求，让 AI 生成更准确的代码。

CUE：智能预测与一键编辑

预测你的下一步编辑：CUE（上下文理解引擎）功能通过分析你的编辑行为来理解你的意图，并预测你的下一步操作。
一键导航与应用：只需按下 Tab 键即可跳转到下一个建议的改动，或一次性应用跨多行的智能建议。
持续优化：该功能持续优化以获得更好的性能和响应速度，为代码修改、生成和 Bug 修复提供更流畅的体验。

全面的 IDE 功能与 AI 辅助

双重开发模式：提供 IDE 模式，用于传统的用户控制工作流；以及 SOLO 模式，AI 主导从需求到交付的整个开发过程，实现完全自动化。
功能齐全的 IDE：提供标准的 IDE 功能，如代码编辑、项目管理和版本控制。
AI 编程辅助：具备多种 AI 驱动的辅助功能，包括智能代码补全、重构、基于聊天的问答以及从自然语言生成项目。
内置网页预览：支持在 IDE 内直接预览网页，便于前端开发和调试。

什么是 Trae Solo？

统一的工作区与 AI 工具中心：
SOLO 模式将所有必要的开发工具——IDE、浏览器、终端和文档——直接集成到 AI 中。这使得 AI 能够根据每个任务的具体需求进行精确推理和行动，无缝地弥合从想法到执行的差距。
AI 主导的全栈开发：
你只需提供需求，SOLO 自动处理整个开发生命周期，包括：
- 需求分析
- 原型设计
- 前端开发
- 后端开发
- 调试与优化
- 构建与部署
统一监控视图：
用户可以从一个统一的视图与 AI 聊天并监控所有开发活动。“扩展视图”提供了所有实时执行细节的详细查看。
多模态交互：“说出”你的需求：
SOLO 模式支持语音输入，让你像与人类队友交流一样自然地与 TRAE 交互。AI 的输出不限于代码；右侧可展开的动态视图提供视觉化和直观的反馈。
上下文工程师：
SOLO 模式被设计为终极“上下文工程师”，能够理解你工作的全部范围，以确保其行动和输出基于最全面和准确的信息。

总之，TRAE SOLO 模式的目标是实现“能够交付完整软件的 AI”。它通过简单的“对话、思考、交付”流程，让开发者能够更快地构建和发布真正的软件。

什么是 GPT OSS？

GPT-OSS（开源系列）是 OpenAI 发布的一系列强大、开源的权重语言模型，旨在免费用于商业用途，并可在消费级硬件上本地运行。该系列包括两个主要模型，一个 200 亿参数版本和一个 1200 亿参数版本，它们针对强大的推理、工具使用和效率进行了优化，标志着 OpenAI 朝着 AI 社区更高的透明度迈出了重要一步。这些模型允许开发者和研究人员对它们进行微调，以实现自定义目的，并完全控制自己的数据和基础设施，从而弥合了封闭、专有系统与开源 AI 之间的鸿沟。


Model	Layers	Total Params	Active Params Per Token	Total Experts	Active Experts Per Token	Context Length	Single GPU VRAM Requirement
gpt-oss-120b	36	117B	5.1B	128	4	128k	80GB
gpt-oss-20b	24	21B	3.6B	32	4	128k	16GB

为什么选择 GPT OSS 进行 AI 编码？

自定义格式：Harmony

GPT‑OSS 模型使用一种称为 Harmony 的特殊对话格式。这种格式将消息组织成清晰的角色——system、user 和 assistant——并让你控制模型的思考和响应方式。使用 Harmony，你可以调整推理深度（低、中、高），决定是显示还是隐藏思考过程，并让模型以稳定、结构化的方式调用函数。许多其他开源模型没有内置这些控制，但 GPT‑OSS 原生理解它们，因为它是在遵循 Harmony 指令的情况下训练的。这使得获得一致、可靠且易于工具使用的输出更加容易。

Harmony 可以控制什么

Harmony 格式允许你为 GPT‑OSS 模型调整几个关键行为参数：

参数	描述	示例
推理深度	控制模型进行逐步思考的程度。	`"Reasoning: low"`、`"Reasoning: medium"`、`"Reasoning: high"`
函数调用	原生支持 OpenAI 风格的 `function_call` / `tool_calls` JSON 输出。	`"当被问及天气时，始终调用 weather_api"`
推理可见性	显示或隐藏 `thinking` 标签内的完整思维链。	`"Show reasoning"` / `"Hide reasoning"`
输出格式规则	强制输出结构化格式，如 JSON、Markdown 等。	`"Output in JSON format"`

一个 Harmony 请求示例

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "解释快排的工作原理。"
    }
  ]
}

与 Trae 等工具一起使用 Harmony 的好处

当与像 Trae 这样的代码生成、调试和执行平台集成时，Harmony 格式提供了几个实际优势：

稳定的结构化输出
- Harmony 确保模型的输出遵循可预测的 JSON 或代码块格式。
- Trae 可以直接解析这些输出，无需脆弱的正则表达式或后处理。
推理深度控制
- 对于快速原型设计或简单代码，使用低推理。
- 对于正确性至关重要的复杂算法，使用高推理。
- 通过匹配任务复杂度的推理成本来节省 GPU/CPU 资源。
切换推理可见性
- 显示 thinking 推理以进行调试和学习。
- 在生产中隐藏推理以减少 Token 并避免泄露内部逻辑。
清晰的多轮上下文管理
- system 规则跨轮次持久化，确保一致的代码风格和执行规则。
- 易于迭代：修改用户指令而不丢失全局设置。
无缝 API 集成
- Harmony 模仿 OpenAI Responses API，因此任何与 OpenAI 兼容的工具链或 IDE 插件都可以在几乎不修改的情况下使用 GPT‑OSS。

GPT OSS 工具使用

GPT‑OSS 模型经过训练，可以在其推理过程中原生使用外部工具，内置支持 **浏览 **、**Python 执行 ** 和 ** 文件修补 **。这些工具通过在 Harmony 格式 的提示的 system 消息中定义来激活。

1. 浏览器工具

用途： 搜索网页、打开页面、在页面上查找文本。
方法：
- search — 搜索关键词短语。
- open — 打开特定页面。
- find — 定位页面上的内容。
功能：
- 可滚动的文本窗口以管理上下文大小。
- 缓存以更快地重新访问同一页面。
- 训练有素地在答案中引用来源。
用法： 通过在 system 提示中添加 .with_browser() 或 .with_tools() 来添加浏览器工具定义。
注意： 参考实现仅用于教育目的——在生产中使用你自己的后端。

2. Python 工具

用途： 作为思维链的一部分执行计算或运行小程序。
功能：
- 使用有状态的 Python 工具进行多步推理训练。
- 参考实现使用 无状态 模式。
- 可以覆盖 openai‑harmony 中的默认工具描述。
用法： 通过在 system 提示中添加 .with_python() 或 .with_tools() 来添加。
安全警告： 参考代码在宽松的 Docker 容器中运行——在生产中添加你自己的限制。

3. 应用补丁工具

用途： 创建、更新或删除本地文件。
用例： 作为自动化开发循环的一部分修改代码或项目文件。

如何在 Trae 中使用 GPT OSS？

前提条件：获取 API Key

Novita AI 提供 GPT-OSS 120B
API，支持 **131K 上下文 **，价格为 **$0.1/输入 ** 和 **$0.5/输出 **。Novita AI 还提供 GPT-OSS 20B，支持 131 上下文，价格为 **$0.05/输入 ** 和 $0.2/输出，为充分发挥 GPT OSS 的代码智能体潜力提供强力支持。

Novita AI

第 1 步：登录并访问模型库

登录你的账户，点击 模型库 按钮。

立即尝试 GPT OSS！

第 2 步：选择你的模型

浏览可用选项，选择适合你需求的模型。

第 3 步：开始免费试用

开始免费试用，探索所选模型的功能。

第 4 步：获取你的 API Key

为了通过 API 进行身份验证，我们将为你提供一个新 API Key。进入“设置”页面，你可以按照图片指示复制 API Key。

第 5 步：安装 API

使用你编程语言特定的包管理器安装 API。

安装后，将必要的库导入你的开发环境。使用你的 API Key 初始化 API，开始与 Novita AI LLM 交互。这是一个为 Python 用户使用聊天补全 API 的示例。

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

在 TRAE 中使用 GPT‑OSS

第 1 步：打开 Trae 并访问模型

启动 Trae 应用。点击右上角的 **切换 AI 侧边栏 ** 以打开 **AI 侧边栏 **。然后，进入 **AI 管理 ，选择 ** 模型。

第 2 步：添加自定义模型并选择 Novita 为提供商，然后选择模型

点击 添加模型 ** 按钮创建一个自定义模型条目。在添加模型对话框中，从下拉菜单选择 ** 提供商 = Novita。

从模型下拉菜单中，选择你想要的模型（DeepSeek-R1-0528、Kimi K2、GLM 4.5、DeepSeek-V3-0324 或 MiniMax-M1-80k）。如果确切模型未列出，只需输入你从 Novita 库中记下的模型 ID。确保选择你想使用的模型的正确保留字串。

第 3 步：输入你的 API Key

从你的 Novita 控制台复制 Novita AI API Key，并将其粘贴到 Trae 中的 API Key 字段。

获取 Novita AI API Key！

GPT OSS 的限制

特性	GPT-OSS（自托管模型）	GPT-5 API（托管平台）
核心提供	一个原始模型（“引擎”）	一个完整的、集成的平台（“汽车”）
模型能力	强大，但落后一代	最先进、旗舰级推理
内置工具	无。需要大量的 DIY 工作。	完全托管：网络搜索、文件搜索、代码解释器。
上下文窗口	实际受限于你的硬件（例如 8k-32k）	巨大（400k），完全托管。
智能体框架	使用开源库 DIY。无可观测性。	集成的 SDK，内置可观测性。
企业特性	无。无合规、SSO 或管理控制。	完整套件： SOC 2、HIPAA、RBAC、SSO 等。
支持	社区驱动和自助服务。	专门的客户团队和优先支持。
维护	你的全部责任。设置、扩展、正常运行时间。	零。完全由 OpenAI 处理。

将 GPT‑OSS 与 TRAE 集成带来了两全其美的效果：

GPT‑OSS 是“大脑”，通过 Harmony 格式 控制以调整推理深度、结构化输出以及隐藏或显示思考过程。
TRAE 是“身体”，提供集成的工作区、工具连接和自主软件生命周期管理——尤其是在 SOLO 模式下。
Novita AI 弥合了差距，为你托管 GPT‑OSS，因此你可以通过 API 使用它，而无需昂贵的硬件。

这种组合让开发者能够构建一个自定义的“AI 工程师”，该工程师理解他们的需求并按照预期精确执行，使得真正自主的软件交付成为可能。

常见问题解答

为什么使用 GPT‑OSS 结合 TRAE，而不是闭源 API 模型？

你可以获得完全的控制权。Harmony 格式让 TRAE 控制推理深度、输出格式以及是否显示思考过程。你还可以在自有代码上微调 GPT‑OSS 以实现完美匹配。

我需要自己托管 GPT‑OSS 吗？

不需要。像 Novita AI 这样的服务会为你托管，并提供 API Key，因此你不需要昂贵的 GPU 或复杂的设置。

什么是 Harmony 格式，为什么它很重要？

这是 GPT‑OSS 能理解的一种特殊消息格式。它使输出稳定、结构化，并且易于 TRAE 处理——无需脆弱的解析。

Novita AI 是一个一体化云平台，助力你的 AI 雄心。集成的 API、无服务器、GPU 实例——你所需的成本效益工具。消除基础设施，免费开始，让你的 AI 愿景成为现实。

在 TRAE 中使用 GPT‑OSS：解锁适合 AI 编码的 Harmony 格式

什么是 Trae？

Trae 的关键功能

什么是 Trae Solo？

什么是 GPT OSS？

为什么选择 GPT OSS 进行 AI 编码？

自定义格式：Harmony

Harmony 可以控制什么

与 Trae 等工具一起使用 Harmony 的好处

GPT OSS 工具使用

如何在 Trae 中使用 GPT OSS？

前提条件：获取 API Key

在 TRAE 中使用 GPT‑OSS

GPT OSS 的限制

常见问题解答

推荐阅读

Product

RESOURCES

Partners

Company

什么是 Trae？

Trae 的关键功能

什么是 Trae Solo？

什么是 GPT OSS？

为什么选择 GPT OSS 进行 AI 编码？

自定义格式：Harmony

Harmony 可以控制什么

与 Trae 等工具一起使用 Harmony 的好处

GPT OSS 工具使用

如何在 Trae 中使用 GPT OSS？

前提条件：获取 API Key

在 TRAE 中使用 GPT‑OSS

GPT OSS 的限制

常见问题解答

推荐阅读

相关文章

Product

RESOURCES

Partners

Company