Use GPT‑OSS no TRAE: Desbloqueando o Formato Harmony para Codificação com IA

Use GPT‑OSS no TRAE: Desbloqueando o Formato Harmony para Codificação com IA

O desenvolvimento de software impulsionado por IA está avançando rapidamente, impulsionado por duas grandes tendências: modelos poderosos de código aberto e ambientes de desenvolvimento integrados com IA. GPT‑OSS é a série de modelos de pesos abertos da OpenAI, conhecida por forte raciocínio, capacidades semelhantes a agentes e personalização profunda. TRAE, da ByteDance, é uma IDE de IA projetada para atuar como um “Engenheiro de IA” completo que pode construir software por conta própria.

A questão é: o que acontece quando você combina o poder de raciocínio controlável do GPT‑OSS com a estrutura de desenvolvimento automatizada e rica em ferramentas do TRAE? Juntos, eles criam um fluxo de trabalho que é automatizado e adaptado às suas necessidades exatas. Este guia explica como conectá-los e desbloquear todo o seu potencial.

O que é Trae?

TRAE é também o nome de um ambiente de desenvolvimento integrado (IDE) com tecnologia de IA criado pela ByteDance. Ele é projetado para funcionar como um “Engenheiro de IA” que pode construir soluções de software de forma independente, entendendo tarefas complexas e executando-as. O TRAE visa simplificar o fluxo de trabalho de desenvolvimento, permitindo que os usuários deleguem tarefas à IA.

trae

Principais Funções do Trae

Integração Aprimorada de Ferramentas e Capacidades (Model Context Protocol - MCP)

  • Integração com Ferramentas Externas: O TRAE integra-se com várias ferramentas externas, permitindo que os agentes de IA as usem para uma execução de tarefas mais eficaz.
  • Suporte a MCP: Ele suporta o Model Context Protocol (MCP), um padrão aberto para conectar aplicações de IA com fontes de dados e ferramentas externas. Isso funciona como uma porta “USB-C” universal para IA, resolvendo o desafio de conectar modelos de IA a dados isolados.
  • Capacidades Expandidas de IA: Através do MCP, os agentes podem acessar recursos externos como Google Drive, Slack, GitHub e bancos de dados para entender e completar melhor tarefas complexas.

Compreensão Contextual Mais Profunda e Controle Preciso

  • Compreensão Profunda do Contexto de Desenvolvimento: O TRAE entende profundamente seu contexto de desenvolvimento, incluindo repositórios de código, resultados de pesquisa online e documentos compartilhados.
  • Customização Precisa do Comportamento: Você pode personalizar regras para adaptar o comportamento da IA ao seu fluxo de trabalho, garantindo que ela execute as tarefas exatamente como você pretende.
  • Interação Multimodal: Suporta upload de imagens (por exemplo, maquetes de design, capturas de tela de erros) para ajudar a descrever requisitos, permitindo que a IA gere código mais preciso.

CUE: Previsão Inteligente e Edição com Um Toque

  • Prevê Sua Próxima Edição: O recurso CUE (Context Understanding Engine) entende sua intenção e prevê seu próximo movimento analisando seu comportamento de edição.
  • Navegação e Aplicação com Um Toque: Basta pressionar a tecla Tab para pular para a próxima alteração sugerida ou aplicar sugestões inteligentes em várias linhas de uma vez.
  • Otimização Contínua: O recurso é continuamente otimizado para melhor desempenho e responsividade, proporcionando uma experiência mais suave para modificação de código, geração e correção de bugs.

Recursos Abrangentes de IDE e Assistência de IA

  • Modos de Desenvolvimento Duplos: Oferece o Modo IDE para um fluxo de trabalho tradicional controlado pelo usuário, e o Modo SOLO onde a IA lidera o desenvolvimento desde os requisitos até a entrega para automação total.
  • IDE Completa: Fornece recursos padrão de IDE como edição de código, gerenciamento de projetos e controle de versão.
  • Assistência de Programação com IA: Apresenta várias assistências com tecnologia de IA, incluindo conclusão inteligente de código, refatoração, perguntas e respostas baseadas em chat e geração de projetos a partir de linguagem natural.
  • Pré-visualização Web Integrada: Suporta pré-visualização direta de páginas web dentro da IDE para facilitar o desenvolvimento e depuração de front-end.

O que é Trae Solo?

O que é Trae Solo?

  • Espaço de Trabalho Unificado & Hub de Ferramentas de IA:
    O modo SOLO integra todas as ferramentas de desenvolvimento necessárias — IDE, navegador, terminal e documentos — diretamente na IA. Isso permite que a IA raciocine e aja com precisão com base nas necessidades específicas de cada tarefa, preenchendo perfeitamente a lacuna entre a ideia e a execução.
  • Desenvolvimento Liderado por IA, Ponto a Ponto:
    Você simplesmente fornece os requisitos, e o SOLO lida autonomamente com todo o ciclo de vida do desenvolvimento, incluindo:
    • Análise de Requisitos
    • Prototipagem
    • Desenvolvimento Front-end
    • Desenvolvimento Back-end
    • Depuração e Otimização
    • Build e Implantação
  • Visão de Monitoramento Unificada:
    Os usuários podem conversar com a IA e monitorar todas as atividades de desenvolvimento de uma única visão unificada. A “Visão Estendida” fornece uma visualização detalhada de todos os detalhes de execução em tempo real.
  • Interação Multimodal: “Fale” Seus Requisitos:
    O modo SOLO suporta entrada de voz, permitindo que você interaja com o TRAE tão naturalmente quanto com um colega humano. A saída da IA não se limita a código; uma visão dinâmica expansível à direita fornece feedback visual e intuitivo.
  • O Engenheiro de Contexto:
    O modo SOLO é projetado para ser o “Engenheiro de Contexto” definitivo, capaz de entender todo o escopo do seu trabalho para garantir que suas ações e saídas sejam baseadas nas informações mais abrangentes e precisas disponíveis.

Em resumo, o objetivo do modo TRAE SOLO é permitir “IA que entrega software completo”. Ele capacita os desenvolvedores a construir e lançar software real mais rapidamente através de um processo simples “Fale. Pense. Entregue.”

O que é GPT OSS?

GPT-OSS (Open-Source Series) é uma família de modelos de linguagem de pesos abertos e poderosos lançados pela OpenAI, projetados para serem livremente disponíveis para uso comercial e executados localmente em hardware de consumo. A série inclui dois modelos principais, uma versão de 20 bilhões e uma de 120 bilhões de parâmetros, otimizados para forte raciocínio, uso de ferramentas e eficiência, marcando uma mudança significativa da OpenAI em direção a uma maior transparência na comunidade de IA. Esses modelos permitem que desenvolvedores e pesquisadores os ajustem para fins personalizados com controle total sobre seus dados e infraestrutura, preenchendo a lacuna entre sistemas fechados e proprietários e IA de código aberto.

Modelo Camadas Total de Parâmetros Parâmetros Ativos por Token Total de Especialistas Especialistas Ativos por Token Comprimento do Contexto Requisito de VRAM de GPU Única
gpt-oss-120b 36 117B 5.1B 128 4 128k 80GB
gpt-oss-20b 24 21B 3.6B 32 4 128k 16GB

benchmark do gpt oss

Por que escolher GPT OSS para código de IA?

Personalizar Formato: Harmony

Os modelos GPT‑OSS usam um formato de conversação especial chamado Harmony. Este formato organiza as mensagens em papéis claros — system, user, e assistant — e permite que você controle como o modelo pensa e responde. Com o Harmony, você pode ajustar a profundidade do raciocínio (baixa, média, alta), decidir se mostra ou esconde o processo de pensamento e fazer o modelo chamar funções de forma estável e estruturada. Muitos outros modelos de código aberto não possuem esses controles embutidos, mas o GPT‑OSS os entende nativamente porque foi treinado para seguir as instruções do Harmony. Isso torna mais fácil obter saídas consistentes, confiáveis e amigáveis para ferramentas.

O que o Harmony pode controlar

O formato Harmony permite ajustar vários parâmetros de comportamento chave para os modelos GPT‑OSS:

Parâmetro Descrição Exemplo
Profundidade do Raciocínio Controla quanto pensamento passo a passo o modelo realiza. "Reasoning: low", "Reasoning: medium", "Reasoning: high"
Chamada de Função Suporte nativo para saída JSON function_call / tool_calls no estilo OpenAI. "Always call function weather_api when asked about weather"
Visibilidade do Raciocínio Mostrar ou esconder a cadeia de pensamento completa nas tags thinking. "Show reasoning" / "Hide reasoning"
Regras de Formato de Saída Forçar saída estruturada como JSON, Markdown, etc. "Output in JSON format"

Um Exemplo de Requisição Harmony

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Explain how quicksort works."
    }
  ]
}

Benefícios ao Usar Harmony com Ferramentas como Trae

Quando integrado a plataformas de geração de código, depuração e execução como o Trae, o formato Harmony oferece várias vantagens práticas:

  1. Saída Estruturada Estável

    • O Harmony garante que a saída do modelo siga um formato JSON ou bloco de código previsível.
    • O Trae pode analisar isso diretamente sem expressões regulares frágeis ou pós-processamento.
  2. Controle da Profundidade do Raciocínio

    • Use raciocínio baixo para prototipagem rápida ou código simples.
    • Use raciocínio alto para algoritmos complexos onde a correção é mais importante.
    • Economiza recursos de GPU/CPU ao combinar o custo do raciocínio com a complexidade da tarefa.
  3. Alternar Visibilidade do Raciocínio

    • Mostrar o raciocínio thinking para depuração e aprendizado.
    • Esconder o raciocínio em produção para reduzir tokens e evitar vazamento de lógica interna.
  4. Gerenciamento Claro de Contexto Multiturno

    • As regras system persistem entre turnos, garantindo estilo de código e regras de execução consistentes.
    • Fácil de iterar: modifique as instruções do usuário sem perder as configurações globais.
  5. Integração Perfeita com API

    • O Harmony imita a API Responses da OpenAI, então qualquer conjunto de ferramentas ou plugin de IDE compatível com OpenAI pode funcionar com o GPT‑OSS com mudanças mínimas.

Uso de Ferramentas GPT OSS

Os modelos GPT‑OSS são treinados para usar ferramentas externas nativamente como parte de seu processo de raciocínio, com suporte embutido para navegação, execução Python e aplicação de patches em arquivos. Essas ferramentas são ativadas definindo-as na mensagem system de um prompt formatado em Harmony.

1. Ferramenta de Navegador

  • Propósito: Pesquisar na web, abrir páginas e encontrar texto em páginas.

  • Métodos:

    • search — pesquisar por frases-chave.
    • open — abrir uma página específica.
    • find — localizar conteúdo em uma página.
  • Recursos:

    • Janela de texto rolável para gerenciar o tamanho do contexto.
    • Cache para revisitas mais rápidas à mesma página.
    • Treinado para citar fontes nas respostas.
  • Uso: Adicione a definição da ferramenta de navegador via .with_browser() ou .with_tools() no prompt system.

  • Nota: A implementação de referência é apenas para fins educacionais — use seu próprio backend em produção.

2. Ferramenta Python

  • Propósito: Realizar cálculos ou executar pequenos programas como parte da cadeia de pensamento.

  • Recursos:

    • Treinado com uma ferramenta Python com estado para raciocínio em várias etapas.
    • A implementação de referência usa um modo sem estado.
    • Pode substituir as descrições de ferramentas padrão em openai‑harmony.
  • Uso: Adicione via .with_python() ou .with_tools() no prompt system.

  • Aviso de Segurança: O código de referência é executado em um contêiner Docker permissivo — adicione suas próprias restrições em produção.

3. Ferramenta Apply Patch

  • Propósito: Criar, atualizar ou excluir arquivos locais.
  • Caso de Uso: Modificar código ou arquivos de projeto como parte de um loop de desenvolvimento automatizado.

Como usar GPT OSS no Trae?

Pré-requisitos: Obter Chave de API

A Novita AI fornece APIs do GPT-OSS 120B
com contexto de 131K e custos de $0.1/entrada e $0.5/saída. A Novita AI também fornece o GPT-OSS 20B com contexto de 131 e custos de $0.05/entrada e $0.2/saída, oferecendo forte suporte para maximizar o potencial do agente de código do GPT OSS.

Novita AI

Passo 1: Faça Login e Acesse a Biblioteca de Modelos

Faça login na sua conta e clique no botão Model Library.

Faça Login e Acesse a Biblioteca de Modelos

Experimente o GPT OSS Agora!

Passo 2: Escolha Seu Modelo

Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Passo 2: Escolha Seu Modelo

Passo 3: Inicie Seu Teste Gratuito

Inicie seu teste gratuito para explorar as capacidades do modelo selecionado.

Passo 3: Inicie Seu Teste Gratuito

Passo 4: Obtenha Sua Chave de API

Para autenticar com a API, forneceremos uma nova chave de API. Entrando na página “Settings”, você pode copiar a chave de API conforme indicado na imagem.

obter chave de api

Passo 5: Instale a API

Instale a API usando o gerenciador de pacotes específico para sua linguagem de programação.

Após a instalação, importe as bibliotecas necessárias para seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o Novita AI LLM. Este é um exemplo de uso da API de chat completions para usuários Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Usar GPT‑OSS no TRAE

Passo 1: Abra o Trae e Acesse os Modelos

Inicie o aplicativo Trae. Clique em Toggle AI Side Bar no canto superior direito para abrir a AI Side Bar. Em seguida, vá para AI Management e selecione Models.

Alternar AI Side Bar

vá para AI Management e selecione Models

Passo 2: Adicione um Modelo Personalizado e Escolha Novita como Provedor e Selecione Modelos

Clique no botão Add Model para criar uma entrada de modelo personalizada. Na caixa de diálogo de adicionar modelo, selecione Provider = Novita no menu suspenso.

No menu suspenso Model, escolha o modelo desejado (DeepSeek-R1-0528, Kimi K2, GLM 4.5, DeepSeek-V3-0324 ou MiniMax-M1-80k). Se o modelo exato não estiver listado, basta digitar o ID do modelo que você anotou na biblioteca Novita. Certifique-se de escolher a variante correta do modelo que deseja usar.

Adicione um Modelo Personalizado

Escolha Novita como Prov

Passo 3: Insira Sua Chave de API

Copie a chave de API do Novita AI do seu console Novita e cole-a no campo API Key no Trae.

obter chave de api

Obtenha a Chave de API do Novita AI!

Limitação do GPT OSS

Recurso GPT-OSS (Modelo Auto-hospedado) API GPT-5 (Plataforma Gerenciada)
Oferta Principal Um modelo bruto (o “motor”) Uma plataforma completa e integrada (o “carro”)
Capacidade do Modelo Forte, mas uma geração atrás Estado da arte, raciocínio principal
Ferramentas Embutidas Nenhuma. Requer enorme esforço DIY. Totalmente Gerenciado: Pesquisa Web, Pesquisa de Arquivos, Interpretador de Código.
Janela de Contexto Praticamente limitada pelo seu hardware (ex.: 8k-32k) Massiva (400k), totalmente gerenciada.
Framework de Agente DIY com bibliotecas de código aberto. Sem observabilidade. SDK integrado com observabilidade embutida.
Recursos Empresariais Nenhum. Sem conformidade, SSO ou controles administrativos. Pacote Completo: SOC 2, HIPAA, RBAC, SSO, etc.
Suporte Baseado na comunidade e autoatendimento. Equipe de contato dedicada e suporte priorizado.
Manutenção Sua total responsabilidade. Configuração, escalonamento, disponibilidade. Zero. Tratado inteiramente pela OpenAI.

Integrar o GPT‑OSS com o TRAE traz o melhor de dois mundos:

  • GPT‑OSS é o “cérebro”, controlado através do formato Harmony para ajustar a profundidade do raciocínio, estruturar saídas e ocultar ou mostrar processos de pensamento.
  • TRAE é o “corpo”, oferecendo um espaço de trabalho integrado, conexões de ferramentas e gerenciamento autônomo do ciclo de vida do software — especialmente no Modo SOLO.
  • Novita AI preenche a lacuna, hospedando o GPT‑OSS para que você possa usá-lo via API sem hardware caro.

Essa combinação permite que os desenvolvedores construam um “Engenheiro de IA” personalizado que entende seus requisitos e os executa exatamente como pretendido, tornando possível a entrega de software verdadeiramente autônoma.

Perguntas Frequentes

Por que usar GPT‑OSS com TRAE em vez de um modelo de API de código fechado?

Você obtém controle total. O formato Harmony permite que o TRAE controle a profundidade do raciocínio, o formato da saída e se o processo de pensamento é mostrado. Você também pode ajustar o GPT‑OSS em seu próprio código para um ajuste perfeito.

Preciso hospedar o GPT‑OSS eu mesmo?

Não. Serviços como Novita AI o hospedam para você e fornecem uma chave de API, então você não precisa de GPUs caras ou configuração complexa.

O que é o formato Harmony e por que é importante?

É um formato de mensagem especial que o GPT‑OSS entende. Ele torna as saídas estáveis, estruturadas e fáceis de processar pelo TRAE — sem necessidade de análise frágil.

Novita AI é a plataforma completa em nuvem que impulsiona suas ambições de IA. APIs integradas, serverless, instância GPU — as ferramentas econômicas que você precisa. Elimine a infraestrutura, comece gratuitamente e torne sua visão de IA realidade.

Leitura Recomendada

Qwen 3 em Pipelines RAG: Modelo LLM, Embedding e Reranking Tudo-em-Um

Trae ou Claude Code: Qual é Mais Adequado para Usar com Kimi K2?

DeepSeek R1 0528 Custo: Comparação de API, GPU, On-Prem