AI驱动的软件开发正在快速发展,背后有两大核心趋势:强大的开源模型和高度集成的AI开发环境。GPT‑OSS 是OpenAI推出的开源权重模型系列,以强大的推理能力、类智能体特性和深度可定制性著称。TRAE 是字节跳动推出的AI IDE,旨在充当能够独立构建软件的完整“AI工程师”。
那么问题来了:如果将GPT‑OSS的可控推理能力与TRAE工具丰富、自动化的开发框架结合,会碰撞出怎样的火花?二者结合将打造出既自动化又能精准适配你需求的工作流。本指南将讲解如何将二者对接,释放它们的全部潜力。
什么是Trae?
TRAE 也是字节跳动推出的AI驱动集成开发环境(IDE)的名称。它被设计为“AI工程师”,能够理解复杂任务并自主执行,独立构建软件解决方案。TRAE的目标是通过允许用户将任务委托给AI,简化开发工作流。

Trae的核心功能
增强的工具集成与能力(模型上下文协议 - MCP)
- 外部工具集成:TRAE集成了多种外部工具,使AI智能体能够调用这些工具更高效地执行任务。
- MCP支持:它支持模型上下文协议(MCP),这是一项用于连接AI应用与外部数据源、工具的开源标准。它相当于AI的通用“USB-C”接口,解决了AI模型与孤立数据连接的难题。
- 扩展的AI能力:通过MCP,智能体可以访问Google Drive、Slack、GitHub和数据库等外部资源,更好地理解并完成复杂任务。
更深入的上下文理解与精准控制
- 深度理解开发上下文:TRAE能够深度理解你的开发上下文,包括代码仓库、在线搜索结果和共享文档。
- 精准的行为定制:你可以自定义规则,让AI的行为适配你的工作流,确保它完全按照你的预期执行任务。
- 多模态交互:支持上传图片(如设计稿、错误截图)辅助描述需求,让AI生成更准确的代码。
CUE:智能预测与一键编辑
- 预测你的下一步编辑:CUE(上下文理解引擎)功能会理解你的意图,通过分析你的编辑行为预测你的下一步操作。
- 一键导航与应用:只需按下
Tab键,即可跳转到下一个建议修改的位置,或一次性应用多行智能建议。 - 持续优化:该功能会持续迭代优化性能和响应速度,为代码修改、生成和bug修复提供更流畅的体验。
全面的IDE功能与AI辅助
- 双开发模式:提供IDE模式(传统的用户可控工作流)和SOLO模式(AI从需求到交付全流程主导开发,实现完全自动化)。
- 全功能IDE:提供代码编辑、项目管理、版本控制等标准IDE功能。
- AI编程辅助:提供多种AI驱动的辅助功能,包括智能代码补全、代码重构、聊天式问答,以及通过自然语言生成项目。
- 内置网页预览:支持在IDE内直接预览网页,简化前端开发和调试流程。
什么是Trae Solo?

- 统一工作空间与AI工具中枢:
SOLO模式将IDE、浏览器、终端、文档等所有必要的开发工具直接集成到AI中,使AI能够基于每个任务的具体需求精准推理和行动,无缝衔接从想法到落地的全流程。 - AI主导的端到端开发:
你只需提供需求,SOLO即可自主处理完整的开发生命周期,包括:- 需求分析
- 原型设计
- 前端开发
- 后端开发
- 调试优化
- 构建部署
- 统一监控视图:
用户可以在单一的统一视图中与AI对话,同时监控所有开发活动。“扩展视图”可以查看所有实时执行的详细信息。 - 多模态交互:“说出”你的需求:
SOLO模式支持语音输入,你可以像和人类队友交流一样自然地与TRAE交互。AI的输出不限于代码,右侧可展开的动态视图会提供直观的可视化反馈。 - 上下文工程师:
SOLO模式被设计为终极“上下文工程师”,能够理解你工作的全貌,确保其行为和输出基于最全面、最准确的信息。
总而言之,TRAE SOLO模式的目标是实现“能交付完整软件的AI”。它通过简单的“对话、思考、交付”流程,赋能开发者更快地构建和发布真实可用的软件。
什么是GPT OSS?
GPT-OSS(开源系列)是OpenAI发布的一系列强大的开源权重语言模型,可免费用于商业用途,也可在消费级硬件上本地运行。该系列包含两款主力模型:200亿参数版本和1200亿参数版本,均针对强推理、工具调用和高效能进行了优化,标志着OpenAI在AI社区向更高透明度迈出了重要一步。开发者和研究人员可以对这些模型进行微调,用于自定义场景,完全掌控自身数据和基础设施,弥合闭源专有系统与开源AI之间的鸿沟。
| Model | Layers | Total Params | Active Params Per Token | Total Experts | Active Experts Per Token | Context Length | Single GPU VRAM Requirement |
| gpt-oss-120b | 36 | 117B | 5.1B | 128 | 4 | 128k | 80GB |
| gpt-oss-20b | 24 | 21B | 3.6B | 32 | 4 | 128k | 16GB |

为什么选择GPT OSS用于AI编程?
自定义格式:Harmony
GPT‑OSS模型使用一种名为Harmony的特殊对话格式。该格式将消息划分为清晰的system、user和assistant角色,允许你控制模型的思考与响应方式。通过Harmony,你可以调整推理深度(低、中、高),决定是否展示思考过程,还能让模型以稳定、结构化的方式调用函数。许多其他开源模型没有内置这些控制功能,但GPT‑OSS原生支持这些指令,因为它是在训练阶段就学习遵循Harmony指令的。这使得你更容易获得一致、可靠、且适配工具调用的输出。
Harmony可控制的参数
Harmony格式允许你调整GPT‑OSS模型的多项核心行为参数:
| Parameter | Description | Example |
|---|---|---|
| Reasoning Depth | 控制模型执行逐步思考的深度。 | "Reasoning: low"、"Reasoning: medium"、"Reasoning: high" |
| Function Calling | 原生支持OpenAI风格的function_call/tool_calls JSON格式输出。 |
"被问及天气时始终调用weather_api函数" |
| Reasoning Visibility | 在<think>标签中展示或隐藏完整的思维链。 |
"Show reasoning" / "Hide reasoning" |
| Output Format Rules | 强制输出JSON、Markdown等结构化格式。 | "以JSON格式输出" |
Harmony请求示例
{
"messages": [
{
"role": "system",
"content": "Reasoning: medium; Hide reasoning; Output in JSON format"
},
{
"role": "user",
"content": "Explain how quicksort works."
}
]
}
将Harmony与Trae等工具结合使用的优势
当与Trae等代码生成、调试、执行平台集成时,Harmony格式具备多项实用优势:
- 稳定的结构化输出
- Harmony可确保模型输出遵循可预测的JSON或代码块格式。
- Trae可以直接解析这类输出,无需脆弱的正则匹配或后处理。
- 推理深度可控
- 简单代码或快速原型开发时使用低推理模式。
- 对正确性要求高的复杂算法使用高推理模式。
- 通过匹配推理成本与任务复杂度,节省GPU/CPU资源。
- 推理可见性切换
- 调试和学习场景下展示
<think>中的推理过程。 - 生产环境隐藏推理过程,减少token消耗,避免泄露内部逻辑。
- 调试和学习场景下展示
- 清晰的多轮上下文管理
system规则在多轮对话中持续生效,确保代码风格和执行规则一致。- 迭代便捷:修改用户指令时不会丢失全局设置。
- 无缝API集成
- Harmony兼容OpenAI Responses API,因此任何与OpenAI兼容的工具链或IDE插件只需少量修改即可与GPT‑OSS适配。
GPT OSS的工具调用
GPT‑OSS模型在训练阶段就原生支持将外部工具作为推理过程的一部分,内置支持网页浏览、Python执行和文件补丁三类工具。只需在Harmony格式的提示词的system消息中定义这些工具,即可激活它们。
1. 网页浏览工具
- 用途:搜索网页、打开页面、在页面中查找文本。
- 调用方法:
search— 搜索关键词短语。open— 打开指定页面。find— 定位页面中的内容。
- 特性:
- 可滚动的文本窗口,用于管理上下文大小。
- 缓存机制,加快同一页面的重复访问速度。
- 训练时已学习在回答中标注来源。
- 使用方法:在
system提示词中通过.with_browser()或.with_tools()添加网页浏览工具的定义。 - 注意:参考实现仅用于教育目的,生产环境请使用你自己的后端服务。
2. Python执行工具
- 用途:执行计算或运行小型程序,作为思维链的一部分。
- 特性:
- 训练时使用了支持状态的Python工具,可用于多步推理。
- 参考实现采用无状态模式。
- 可覆盖
openai-harmony中的默认工具描述。
- 使用方法:在
system提示词中通过.with_python()或.with_tools()添加该工具。 - 安全警告:参考代码在宽松的Docker容器中运行,生产环境请自行添加安全限制。
3. 文件补丁工具
- 用途:创建、更新或删除本地文件。
- 适用场景:在自动化开发循环中修改代码或项目文件。
如何在Trae中使用GPT OSS?
前置条件:获取API密钥
Novita AI提供GPT-OSS 120B的API,支持131K上下文,输入价格为**$0.1/次**,输出价格为**$0.5/次**。Novita AI还提供GPT-OSS 20B的API,支持131K上下文,输入价格为**$0.05/次**,输出价格为**$0.2/次**,为最大化GPT OSS的代码智能体潜力提供强力支持。
Novita AI
步骤1:登录并访问模型库
登录你的账号,点击模型库按钮。

步骤2:选择模型
浏览可用选项,选择适合你需求的模型。

步骤3:开启免费试用
开启免费试用,探索所选模型的能力。

步骤4:获取API密钥
为了完成API身份验证,我们会为你生成新的API密钥。进入“设置”页面,即可按照图中指示复制API密钥。

步骤5:安装API SDK
使用你所用编程语言的包管理器安装API SDK。
安装完成后,将必要的库导入你的开发环境,使用API密钥初始化API,即可开始调用Novita AI的LLM服务。以下是Python用户调用聊天补全API的示例:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
在TRAE中使用GPT‑OSS
步骤1:打开Trae并进入模型设置
启动Trae应用。点击右上角的“切换AI侧边栏”按钮打开AI侧边栏,然后进入AI管理,选择模型选项。


步骤2:添加自定义模型,选择Novita作为服务商并选择模型
点击添加模型按钮创建自定义模型条目。在添加模型的对话框中,从下拉菜单选择服务商 = Novita。
在模型下拉菜单中选择你需要的模型(DeepSeek-R1-0528、Kimi K2、GLM 4.5、DeepSeek-V3-0324或MiniMax-M1-80k)。如果列表中没有你需要的模型,直接输入你在Novita模型库中记录的模型ID即可,确保选择你想要的正确模型版本。


步骤3:输入API密钥
复制你在Novita控制台获取的Novita AI API密钥,粘贴到Trae的API密钥输入框中。

GPT OSS的局限性
| 特性 | GPT-OSS(自托管模型) | GPT-5 API(托管平台) |
|---|---|---|
| 核心产品 | 原始模型(相当于“引擎”) | 完整的集成平台(相当于“整车”) |
| 模型能力 | 能力强劲,但落后一代 | 最先进的旗舰级推理能力 |
| 内置工具 | 无。需要大量自行开发工作。 | 全托管:网页搜索、文件搜索、代码解释器。 |
| 上下文窗口 | 实际受你的硬件限制(例如8k-32k) | 超大(400k),全托管。 |
| 智能体框架 | 使用开源库自行搭建,无可观测性。 | 集成SDK,内置可观测性功能。 |
| 企业级特性 | 无。无合规、SSO或管理员控制功能。 | 全功能套件:SOC 2、HIPAA、RBAC、SSO等。 |
| 支持服务 | 基于社区的自助服务。 | 专属客户经理与优先支持。 |
| 维护责任 | 完全由你承担。包括搭建、扩容、运维。 | 零负担。完全由OpenAI负责。 |
将GPT‑OSS与TRAE结合,可以兼顾两者优势:
- GPT‑OSS 是“大脑”,通过Harmony格式控制,可调整推理深度、结构化输出,以及隐藏或展示思考过程。
- TRAE 是“身体”,提供集成工作空间、工具连接和自主软件生命周期管理,在SOLO模式下表现尤为突出。
- Novita AI 填补了鸿沟,为你托管GPT‑OSS,让你无需昂贵硬件即可通过API使用它。
这种组合让开发者可以打造定制化的“AI工程师”,它能够理解需求并完全按照预期执行,实现真正的自主软件交付。
常见问题
为什么选择GPT‑OSS+TRAE,而不是闭源API模型?
你可以获得完全控制权。Harmony格式允许TRAE控制推理深度、输出格式,以及是否展示思考过程。你还可以用自己的代码微调GPT‑OSS,实现完美适配。
我需要自己托管GPT‑OSS吗?
不需要。Novita AI 这类服务会为你托管模型并提供API密钥,你无需购买昂贵的GPU,也无需进行复杂配置。
什么是Harmony格式,它为什么重要?
它是GPT‑OSS原生支持的特殊消息格式。它让输出更稳定、结构化,易于TRAE处理,无需脆弱的解析逻辑。
Novita AI 是助力你实现AI愿景的一站式云平台。集成API、无服务器、GPU实例——你需要的低成本工具都在这里。无需操心基础设施,免费即可开始,让你的AI想法落地成真。
推荐阅读
Qwen 3在RAG pipelines中的应用:一体化LLM、嵌入与重排序模型方案
