Usa GPT‑OSS en TRAE: Desbloquea el formato Harmony para la codificación con IA

Usa GPT‑OSS en TRAE: Desbloquea el formato Harmony para la codificación con IA

El desarrollo de software impulsado por IA avanza rápidamente, impulsado por dos grandes tendencias: modelos de código abierto potentes y entornos de desarrollo con IA totalmente integrados. GPT‑OSS es la serie de modelos de pesos abiertos de OpenAI, conocida por su fuerte razonamiento, capacidades similares a las de un agente y una personalización profunda. TRAE, de ByteDance, es un IDE de IA diseñado para funcionar como un “Ingeniero de IA” completo capaz de construir software de forma autónoma.

La pregunta es: ¿qué sucede cuando combinas el poder de razonamiento controlable de GPT‑OSS con el framework de desarrollo automatizado y repleto de herramientas de TRAE? Juntos, crean un flujo de trabajo que es tanto automatizado como adaptado a tus necesidades exactas. Esta guía explica cómo conectarlos y desbloquear todo su potencial.

¿Qué es Trae?

TRAE es también el nombre de un entorno de desarrollo integrado (IDE) impulsado por IA creado por ByteDance. Está diseñado para funcionar como un “Ingeniero de IA” que puede construir soluciones software de forma independiente, entendiendo tareas complejas y ejecutándolas. TRAE tiene como objetivo agilizar el flujo de trabajo de desarrollo permitiendo a los usuarios delegar tareas a la IA.

trae

Funciones clave de Trae

Integración y capacidades mejoradas de herramientas (Protocolo de Contexto de Modelo - MCP)

  • Integración de herramientas externas: TRAE se integra con diversas herramientas externas, permitiendo a los agentes de IA usarlas para ejecutar tareas de forma más efectiva.
  • Compatibilidad con MCP: Es compatible con el Protocolo de Contexto de Modelo (MCP), un estándar abierto para conectar aplicaciones de IA con fuentes de datos y herramientas externas. Esto actúa como un puerto “USB-C” universal para la IA, resolviendo el desafío de conectar modelos de IA con datos aislados.
  • Capacidades de IA ampliadas: A través de MCP, los agentes pueden acceder a recursos externos como Google Drive, Slack, GitHub y bases de datos para comprender y completar mejor tareas complejas.

Comprensión contextual más profunda y control preciso

  • Comprensión profunda del contexto de desarrollo: TRAE comprende en profundidad tu contexto de desarrollo, incluyendo repositorios de código, resultados de búsqueda en línea y documentos compartidos.
  • Personalización precisa del comportamiento: Puedes personalizar reglas para adaptar el comportamiento de la IA a tu flujo de trabajo, garantizando que ejecute las tareas exactamente como tú pretendes.
  • Interacción multimodal: Admite la carga de imágenes (por ejemplo, mockups de diseño, capturas de pantalla de errores) para ayudar a describir requisitos, permitiendo a la IA generar código más preciso.

CUE: Predicción inteligente y edición con una tecla

  • Predice tu próxima edición: La función CUE (Motor de Comprensión de Contexto) entiende tu intención y predice tu próximo movimiento analizando tu comportamiento de edición.
  • Navegación y aplicación con una tecla: Simplemente presiona la tecla Tab para saltar al siguiente cambio sugerido o aplicar sugerencias inteligentes en varias líneas a la vez.
  • Optimización continua: La función se optimiza constantemente para mejorar el rendimiento y la capacidad de respuesta, ofreciendo una experiencia más fluida para la modificación, generación y corrección de código.

Funciones completas de IDE y asistencia de IA

  • Modos de desarrollo dual: Ofrece el Modo IDE para un flujo de trabajo tradicional controlado por el usuario, y el Modo SOLO en el que la IA lidera el desarrollo desde los requisitos hasta la entrega para una automatización completa.
  • IDE completo: Ofrece funciones estándar de IDE como edición de código, gestión de proyectos y control de versiones.
  • Asistencia de programación con IA: Cuenta con diversas asistencias impulsadas por IA, incluyendo finalización inteligente de código, refactorización, preguntas y respuestas por chat y generación de proyectos a partir de lenguaje natural.
  • Vista previa web integrada: Admite la vista previa directa de páginas web dentro del IDE para facilitar el desarrollo y la depuración de front-end.

¿Qué es Trae Solo?

What is Trae Solo?

  • Espacio de trabajo unificado y centro de herramientas de IA:
    El modo SOLO integra todas las herramientas de desarrollo necesarias (el IDE, el navegador, la terminal y los documentos) directamente en la IA. Esto permite a la IA razonar y actuar con precisión en función de las necesidades específicas de cada tarea, cerrando la brecha entre la idea y la ejecución de forma fluida.
  • Desarrollo de extremo a extremo liderado por la IA:
    Solo tienes que proporcionar los requisitos, y SOLO gestiona de forma autónoma todo el ciclo de vida del desarrollo, incluyendo:
    • Análisis de requisitos
    • Creación de prototipos
    • Desarrollo de front-end
    • Desarrollo de back-end
    • Depuración y optimización
    • Compilación y despliegue
  • Vista de monitorización unificada:
    Los usuarios pueden chatear con la IA y monitorizar todas las actividades de desarrollo desde una única vista unificada. La “Vista ampliada” proporciona una visión detallada de todos los detalles de ejecución en tiempo real.
  • Interacción multimodal: “Di” tus requisitos:
    El modo SOLO admite entrada por voz, permitiéndote interactuar con TRAE de forma natural, como lo harías con un compañero de equipo humano. La salida de la IA no se limita al código; una vista dinámica ampliable en la parte derecha proporciona feedback visual e intuitivo.
  • El ingeniero de contexto:
    El modo SOLO está diseñado para ser el “Ingeniero de contexto” definitivo, capaz de comprender el alcance completo de tu trabajo para garantizar que sus acciones y salidas se basen en la información más completa y precisa disponible.

En resumen, el objetivo del modo SOLO de TRAE es permitir una “IA que envía software completo”. Facilita a los desarrolladores construir y lanzar software real más rápido a través de un proceso simple de “Habla. Piensa. Envía.”.

¿Qué es GPT OSS?

GPT-OSS (Serie de código abierto) es una familia de potentes modelos de lenguaje de pesos abiertos lanzada por OpenAI, diseñada para estar disponible gratuitamente para uso comercial y que se puede ejecutar de forma local en hardware de consumo. La serie incluye dos modelos principales, una versión de 20 mil millones y otra de 120 mil millones de parámetros, optimizados para un razonamiento sólido, uso de herramientas y eficiencia, lo que marca un cambio significativo de OpenAI hacia una mayor transparencia en la comunidad de la IA. Estos modelos permiten a desarrolladores e investigadores ajustarlos (fine-tuning) para fines personalizados con control total sobre sus datos e infraestructura, cerrando la brecha entre sistemas cerrados propietarios y la IA de código abierto.

Modelo Capas Parámetros totales Parámetros activos por token Expertos totales Expertos activos por token Longitud de contexto Requisito de VRAM de GPU única
gpt-oss-120b 36 117B 5.1B 128 4 128k 80GB
gpt-oss-20b 24 21B 3.6B 32 4 128k 16GB

gpt oss benchmark

¿Por qué elegir GPT OSS para código con IA?

Personaliza el formato: Harmony

Los modelos GPT‑OSS usan un formato de conversación especial llamado Harmony. Este formato organiza los mensajes en roles claros: system, user y assistant, y te permite controlar cómo piensa y responde el modelo. Con Harmony, puedes ajustar la profundidad de razonamiento (baja, media, alta), decidir si muestras u ocultas el proceso de pensamiento, y hacer que el modelo llame a funciones de forma estable y estructurada. Muchos otros modelos de código abierto no tienen estos controles integrados, pero GPT‑OSS los entiende de forma nativa porque fue entrenado para seguir las instrucciones de Harmony. Esto facilita la obtención de salidas consistentes, fiables y compatibles con herramientas.

Qué puede controlar Harmony

El formato Harmony te permite ajustar varios parámetros clave de comportamiento de los modelos GPT‑OSS:

Parámetro Descripción Ejemplo
Profundidad de razonamiento Controla la cantidad de razonamiento paso a paso que realiza el modelo. "Reasoning: low", "Reasoning: medium", "Reasoning: high"
Llamada a funciones Compatibilidad nativa con salida JSON de estilo OpenAI function_call / tool_calls. "Always call function weather_api when asked about weather"
Visibilidad del razonamiento Muestra u oculta la cadena de pensamiento completa en etiquetas <think>. "Show reasoning" / "Hide reasoning"
Reglas de formato de salida Fuerza una salida estructurada como JSON, Markdown, etc. "Output in JSON format"

Ejemplo de solicitud Harmony

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Explain how quicksort works."
    }
  ]
}

Beneficios de usar Harmony con herramientas como Trae

Cuando se integra con plataformas de generación de código, depuración y ejecución como Trae, el formato Harmony ofrece varias ventajas prácticas:

  1. Salida estructurada estable
    • Harmony garantiza que la salida del modelo siga un formato JSON o de bloque de código predecible.
    • Trae puede analizarla directamente sin expresiones regulares frágiles ni procesamiento posterior.
  2. Control de la profundidad de razonamiento
    • Usa el razonamiento bajo para prototipado rápido o código simple.
    • Usa el razonamiento alto para algoritmos complejos en los que la corrección es fundamental.
    • Ahorra recursos de GPU/CPU al adaptar el coste del razonamiento a la complejidad de la tarea.
  3. Alternar la visibilidad del razonamiento
    • Muestra el razonamiento <think> para depuración y aprendizaje.
    • Oculta el razonamiento en producción para reducir tokens y evitar filtrar lógica interna.
  4. Gestión de contexto multivueltas clara
    • Las reglas system persisten entre vueltas, garantizando un estilo de código y reglas de ejecución consistentes.
    • Fácil de iterar: modifica las instrucciones del usuario sin perder la configuración global.
  5. Integración de API sin interrupciones
    • Harmony imita la API de respuestas de OpenAI, por lo que cualquier cadena de herramientas o complemento de IDE compatible con OpenAI puede funcionar con GPT‑OSS con cambios mínimos.

Uso de herramientas de GPT OSS

Los modelos GPT‑OSS están entrenados para usar herramientas externas de forma nativa como parte de su proceso de razonamiento, con compatibilidad integrada para navegación, ejecución de Python y parcheo de archivos. Estas herramientas se activan definiéndolas en el mensaje system de una solicitud con formato Harmony.

1. Herramienta de navegación

  • Propósito: Buscar en la web, abrir páginas y encontrar texto en ellas.
  • Métodos:
    • search: buscar frases clave.
    • open: abrir una página específica.
    • find: localizar contenido en una página.
  • Características:
    • Ventana de texto desplazable para gestionar el tamaño del contexto.
    • Almacenamiento en caché para revisiones más rápidas de la misma página.
    • Entrenado para citar fuentes en las respuestas.
  • Uso: Añade la definición de la herramienta de navegación mediante .with_browser() o .with_tools() en la solicitud system.
  • Nota: La implementación de referencia es solo para fines educativos: usa tu propio backend en producción.

2. Herramienta de Python

  • Propósito: Realizar cálculos o ejecutar programas pequeños como parte de la cadena de pensamiento.
  • Características:
    • Entrenado con una herramienta de Python con estado para razonamiento de varios pasos.
    • La implementación de referencia usa un modo sin estado.
    • Puede anular las descripciones de herramientas predeterminadas en openai‑harmony.
  • Uso: Añade mediante .with_python() o .with_tools() en la solicitud system.
  • Advertencia de seguridad: El código de referencia se ejecuta en un contenedor Docker permisivo: añade tus propias restricciones en producción.

3. Herramienta de aplicación de parches

  • Propósito: Crear, actualizar o eliminar archivos locales.
  • Caso de uso: Modificar archivos de código o de proyecto como parte de un bucle de desarrollo automatizado.

¿Cómo usar GPT OSS en Trae?

Requisitos previos: Obtén la clave de API

Novita AI proporciona APIs de GPT-OSS 120B con contexto de 131K y costes de $0.1/entrada y $0.5/salida. Novita AI también proporciona GPT-OSS 20B con contexto de 131 y costes de $0.05/entrada y $0.2/salida, ofreciendo un fuerte apoyo para maximizar el potencial del agente de código de GPT OSS.

Novita AI

Paso 1: Inicia sesión y accede a la biblioteca de modelos

Inicia sesión en tu cuenta y haz clic en el botón Biblioteca de modelos.

Log In and Access the Model Library

¡Prueba GPT OSS ahora!

Paso 2: Elige tu modelo

Explora las opciones disponibles y selecciona el modelo que se adapte a tus necesidades.

Step 2: Choose Your Model

Paso 3: Inicia tu prueba gratuita

Comienza tu prueba gratuita para explorar las capacidades del modelo seleccionado.

Step 3: Start Your Free Trial

Paso 4: Obtén tu clave de API

Para autenticarte con la API, te proporcionaremos una nueva clave de API. Entrando en la página de “Ajustes”, puedes copiar la clave de API como se indica en la imagen.

get api key

¡Obtén tu clave de API de Novita AI!

Paso 5: Instala la API

Instala la API usando el gestor de paquetes específico de tu lenguaje de programación.

Después de la instalación, importa las librerías necesarias en tu entorno de desarrollo. Inicializa la API con tu clave de API para empezar a interactuar con el LLM de Novita AI. Este es un ejemplo de uso de la API de finalización de chat para usuarios de Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Usa GPT‑OSS en TRAE

Paso 1: Abre Trae y accede a los modelos

Abre la aplicación Trae. Haz clic en el botón de alternar la barra lateral de IA en la esquina superior derecha para abrir la Barra lateral de IA. Luego, ve a Gestión de IA y selecciona Modelos.

Toggle AI Side Bar

go to AI Management and select Models

Paso 2: Añade un modelo personalizado, elige Novita como proveedor y selecciona los modelos

Haz clic en el botón Añadir modelo para crear una entrada de modelo personalizada. En el diálogo de añadir modelo, selecciona Proveedor = Novita en el menú desplegable.

En el menú desplegable de Modelo, elige el modelo que desees (DeepSeek-R1-0528, Kimi K2, GLM 4.5, DeepSeek-V3-0324 o MiniMax-M1-80k). Si el modelo exacto no aparece en la lista, simplemente escribe el ID del modelo que anotaste de la biblioteca de Novita. Asegúrate de elegir la variante correcta del modelo que quieres usar.

Add a Custom Model

Choose Novita as Prov

Paso 3: Introduce tu clave de API

Copia la clave de API de Novita AI de tu consola de Novita y pégala en el campo Clave de API de Trae.

get api key

¡Obtén tu clave de API de Novita AI!

Limitaciones de GPT OSS

Característica GPT-OSS (Modelo autoalojado) API de GPT-5 (Plataforma gestionada)
Oferta principal Un modelo en bruto (el “motor”) Una plataforma completa e integrada (el “coche”)
Capacidad del modelo Potente, pero una generación por detrás Razonamiento de última generación, insignia
Herramientas integradas Ninguna. Requiere un esfuerzo de bricolaje masivo. Totalmente gestionadas: Búsqueda web, búsqueda de archivos, intérprete de código.
Ventana de contexto Limitada prácticamente por tu hardware (por ejemplo, 8k-32k) Masiva (400k), totalmente gestionada.
Framework de agentes Bricolaje con librerías de código abierto. Sin observabilidad. SDK integrado con observabilidad incorporada.
Funciones empresariales Ninguna. Sin cumplimiento normativo, SSO o controles de administración. Suite completa: SOC 2, HIPAA, RBAC, SSO, etc.
Soporte Basado en la comunidad y autoservicio. Equipo de cuenta dedicado y soporte prioritario.
Mantenimiento Tu responsabilidad total. Configuración, escalado, tiempo de actividad. Cero. Gestionado íntegramente por OpenAI.

Integrar GPT‑OSS con TRAE ofrece lo mejor de ambos mundos:

  • GPT‑OSS es el “cerebro”, controlado mediante el formato Harmony para ajustar la profundidad de razonamiento, estructurar las salidas y ocultar o mostrar los procesos de pensamiento.
  • TRAE es el “cuerpo”, que ofrece un espacio de trabajo integrado, conexiones de herramientas y gestión autónoma del ciclo de vida del software, especialmente en el Modo SOLO.
  • Novita AI cierra la brecha, alojando GPT‑OSS para que puedas usarlo mediante API sin hardware caro.

Esta combinación permite a los desarrolladores construir un “Ingeniero de IA” personalizado que comprende sus requisitos y los ejecuta exactamente como se pretende, haciendo posible la entrega de software verdaderamente autónoma.

Preguntas frecuentes

¿Por qué usar GPT‑OSS con TRAE en lugar de un modelo de API de código cerrado?

Obtienes control total. El formato Harmony permite a TRAE controlar la profundidad de razonamiento, el formato de salida y si se muestra el proceso de pensamiento. También puedes ajustar GPT‑OSS (fine-tuning) con tu propio código para una adaptación perfecta.

¿Necesito alojar GPT‑OSS yo mismo?

No. Servicios como Novita AI lo alojan por ti y te dan una clave de API, por lo que no necesitas GPUs caros ni una configuración compleja.

¿Qué es el formato Harmony y por qué es importante?

Es un formato de mensaje especial que entiende GPT‑OSS. Hace que las salidas sean estables, estructuradas y fáciles de procesar para TRAE: no se necesita un análisis frágil.

Novita AI es la plataforma cloud todo en uno que potencia tus ambiciones de IA. APIs integradas, sin servidor, instancias de GPU: las herramientas económicas que necesitas. Elimina la infraestructura, empieza gratis y haz realidad tu visión de IA.

Lecturas recomendadas

Qwen 3 en pipelines RAG: Modelos todo en uno de LLM, embedding y reranking

Trae o Claude Code: ¿Cuál es más adecuado para usar con Kimi K2?

Coste de DeepSeek R1 0528: Comparativa de API, GPU y local