El desarrollo de software impulsado por IA avanza rápidamente, impulsado por dos grandes tendencias: modelos de código abierto potentes y entornos de desarrollo con IA totalmente integrados. GPT‑OSS es la serie de modelos de pesos abiertos de OpenAI, conocida por su fuerte razonamiento, capacidades similares a las de un agente y una personalización profunda. TRAE, de ByteDance, es un IDE de IA diseñado para funcionar como un “Ingeniero de IA” completo capaz de construir software de forma autónoma.
La pregunta es: ¿qué sucede cuando combinas el poder de razonamiento controlable de GPT‑OSS con el framework de desarrollo automatizado y repleto de herramientas de TRAE? Juntos, crean un flujo de trabajo que es tanto automatizado como adaptado a tus necesidades exactas. Esta guía explica cómo conectarlos y desbloquear todo su potencial.
¿Qué es Trae?
TRAE es también el nombre de un entorno de desarrollo integrado (IDE) impulsado por IA creado por ByteDance. Está diseñado para funcionar como un “Ingeniero de IA” que puede construir soluciones software de forma independiente, entendiendo tareas complejas y ejecutándolas. TRAE tiene como objetivo agilizar el flujo de trabajo de desarrollo permitiendo a los usuarios delegar tareas a la IA.

Funciones clave de Trae
Integración y capacidades mejoradas de herramientas (Protocolo de Contexto de Modelo - MCP)
- Integración de herramientas externas: TRAE se integra con diversas herramientas externas, permitiendo a los agentes de IA usarlas para ejecutar tareas de forma más efectiva.
- Compatibilidad con MCP: Es compatible con el Protocolo de Contexto de Modelo (MCP), un estándar abierto para conectar aplicaciones de IA con fuentes de datos y herramientas externas. Esto actúa como un puerto “USB-C” universal para la IA, resolviendo el desafío de conectar modelos de IA con datos aislados.
- Capacidades de IA ampliadas: A través de MCP, los agentes pueden acceder a recursos externos como Google Drive, Slack, GitHub y bases de datos para comprender y completar mejor tareas complejas.
Comprensión contextual más profunda y control preciso
- Comprensión profunda del contexto de desarrollo: TRAE comprende en profundidad tu contexto de desarrollo, incluyendo repositorios de código, resultados de búsqueda en línea y documentos compartidos.
- Personalización precisa del comportamiento: Puedes personalizar reglas para adaptar el comportamiento de la IA a tu flujo de trabajo, garantizando que ejecute las tareas exactamente como tú pretendes.
- Interacción multimodal: Admite la carga de imágenes (por ejemplo, mockups de diseño, capturas de pantalla de errores) para ayudar a describir requisitos, permitiendo a la IA generar código más preciso.
CUE: Predicción inteligente y edición con una tecla
- Predice tu próxima edición: La función CUE (Motor de Comprensión de Contexto) entiende tu intención y predice tu próximo movimiento analizando tu comportamiento de edición.
- Navegación y aplicación con una tecla: Simplemente presiona la tecla
Tabpara saltar al siguiente cambio sugerido o aplicar sugerencias inteligentes en varias líneas a la vez. - Optimización continua: La función se optimiza constantemente para mejorar el rendimiento y la capacidad de respuesta, ofreciendo una experiencia más fluida para la modificación, generación y corrección de código.
Funciones completas de IDE y asistencia de IA
- Modos de desarrollo dual: Ofrece el Modo IDE para un flujo de trabajo tradicional controlado por el usuario, y el Modo SOLO en el que la IA lidera el desarrollo desde los requisitos hasta la entrega para una automatización completa.
- IDE completo: Ofrece funciones estándar de IDE como edición de código, gestión de proyectos y control de versiones.
- Asistencia de programación con IA: Cuenta con diversas asistencias impulsadas por IA, incluyendo finalización inteligente de código, refactorización, preguntas y respuestas por chat y generación de proyectos a partir de lenguaje natural.
- Vista previa web integrada: Admite la vista previa directa de páginas web dentro del IDE para facilitar el desarrollo y la depuración de front-end.
¿Qué es Trae Solo?

- Espacio de trabajo unificado y centro de herramientas de IA:
El modo SOLO integra todas las herramientas de desarrollo necesarias (el IDE, el navegador, la terminal y los documentos) directamente en la IA. Esto permite a la IA razonar y actuar con precisión en función de las necesidades específicas de cada tarea, cerrando la brecha entre la idea y la ejecución de forma fluida. - Desarrollo de extremo a extremo liderado por la IA:
Solo tienes que proporcionar los requisitos, y SOLO gestiona de forma autónoma todo el ciclo de vida del desarrollo, incluyendo:- Análisis de requisitos
- Creación de prototipos
- Desarrollo de front-end
- Desarrollo de back-end
- Depuración y optimización
- Compilación y despliegue
- Vista de monitorización unificada:
Los usuarios pueden chatear con la IA y monitorizar todas las actividades de desarrollo desde una única vista unificada. La “Vista ampliada” proporciona una visión detallada de todos los detalles de ejecución en tiempo real. - Interacción multimodal: “Di” tus requisitos:
El modo SOLO admite entrada por voz, permitiéndote interactuar con TRAE de forma natural, como lo harías con un compañero de equipo humano. La salida de la IA no se limita al código; una vista dinámica ampliable en la parte derecha proporciona feedback visual e intuitivo. - El ingeniero de contexto:
El modo SOLO está diseñado para ser el “Ingeniero de contexto” definitivo, capaz de comprender el alcance completo de tu trabajo para garantizar que sus acciones y salidas se basen en la información más completa y precisa disponible.
En resumen, el objetivo del modo SOLO de TRAE es permitir una “IA que envía software completo”. Facilita a los desarrolladores construir y lanzar software real más rápido a través de un proceso simple de “Habla. Piensa. Envía.”.
¿Qué es GPT OSS?
GPT-OSS (Serie de código abierto) es una familia de potentes modelos de lenguaje de pesos abiertos lanzada por OpenAI, diseñada para estar disponible gratuitamente para uso comercial y que se puede ejecutar de forma local en hardware de consumo. La serie incluye dos modelos principales, una versión de 20 mil millones y otra de 120 mil millones de parámetros, optimizados para un razonamiento sólido, uso de herramientas y eficiencia, lo que marca un cambio significativo de OpenAI hacia una mayor transparencia en la comunidad de la IA. Estos modelos permiten a desarrolladores e investigadores ajustarlos (fine-tuning) para fines personalizados con control total sobre sus datos e infraestructura, cerrando la brecha entre sistemas cerrados propietarios y la IA de código abierto.
| Modelo | Capas | Parámetros totales | Parámetros activos por token | Expertos totales | Expertos activos por token | Longitud de contexto | Requisito de VRAM de GPU única |
| gpt-oss-120b | 36 | 117B | 5.1B | 128 | 4 | 128k | 80GB |
| gpt-oss-20b | 24 | 21B | 3.6B | 32 | 4 | 128k | 16GB |

¿Por qué elegir GPT OSS para código con IA?
Personaliza el formato: Harmony
Los modelos GPT‑OSS usan un formato de conversación especial llamado Harmony. Este formato organiza los mensajes en roles claros: system, user y assistant, y te permite controlar cómo piensa y responde el modelo. Con Harmony, puedes ajustar la profundidad de razonamiento (baja, media, alta), decidir si muestras u ocultas el proceso de pensamiento, y hacer que el modelo llame a funciones de forma estable y estructurada. Muchos otros modelos de código abierto no tienen estos controles integrados, pero GPT‑OSS los entiende de forma nativa porque fue entrenado para seguir las instrucciones de Harmony. Esto facilita la obtención de salidas consistentes, fiables y compatibles con herramientas.
Qué puede controlar Harmony
El formato Harmony te permite ajustar varios parámetros clave de comportamiento de los modelos GPT‑OSS:
| Parámetro | Descripción | Ejemplo |
|---|---|---|
| Profundidad de razonamiento | Controla la cantidad de razonamiento paso a paso que realiza el modelo. | "Reasoning: low", "Reasoning: medium", "Reasoning: high" |
| Llamada a funciones | Compatibilidad nativa con salida JSON de estilo OpenAI function_call / tool_calls. |
"Always call function weather_api when asked about weather" |
| Visibilidad del razonamiento | Muestra u oculta la cadena de pensamiento completa en etiquetas <think>. |
"Show reasoning" / "Hide reasoning" |
| Reglas de formato de salida | Fuerza una salida estructurada como JSON, Markdown, etc. | "Output in JSON format" |
Ejemplo de solicitud Harmony
{
"messages": [
{
"role": "system",
"content": "Reasoning: medium; Hide reasoning; Output in JSON format"
},
{
"role": "user",
"content": "Explain how quicksort works."
}
]
}
Beneficios de usar Harmony con herramientas como Trae
Cuando se integra con plataformas de generación de código, depuración y ejecución como Trae, el formato Harmony ofrece varias ventajas prácticas:
- Salida estructurada estable
- Harmony garantiza que la salida del modelo siga un formato JSON o de bloque de código predecible.
- Trae puede analizarla directamente sin expresiones regulares frágiles ni procesamiento posterior.
- Control de la profundidad de razonamiento
- Usa el razonamiento bajo para prototipado rápido o código simple.
- Usa el razonamiento alto para algoritmos complejos en los que la corrección es fundamental.
- Ahorra recursos de GPU/CPU al adaptar el coste del razonamiento a la complejidad de la tarea.
- Alternar la visibilidad del razonamiento
- Muestra el razonamiento
<think>para depuración y aprendizaje. - Oculta el razonamiento en producción para reducir tokens y evitar filtrar lógica interna.
- Muestra el razonamiento
- Gestión de contexto multivueltas clara
- Las reglas
systempersisten entre vueltas, garantizando un estilo de código y reglas de ejecución consistentes. - Fácil de iterar: modifica las instrucciones del usuario sin perder la configuración global.
- Las reglas
- Integración de API sin interrupciones
- Harmony imita la API de respuestas de OpenAI, por lo que cualquier cadena de herramientas o complemento de IDE compatible con OpenAI puede funcionar con GPT‑OSS con cambios mínimos.
Uso de herramientas de GPT OSS
Los modelos GPT‑OSS están entrenados para usar herramientas externas de forma nativa como parte de su proceso de razonamiento, con compatibilidad integrada para navegación, ejecución de Python y parcheo de archivos. Estas herramientas se activan definiéndolas en el mensaje system de una solicitud con formato Harmony.
1. Herramienta de navegación
- Propósito: Buscar en la web, abrir páginas y encontrar texto en ellas.
- Métodos:
search: buscar frases clave.open: abrir una página específica.find: localizar contenido en una página.
- Características:
- Ventana de texto desplazable para gestionar el tamaño del contexto.
- Almacenamiento en caché para revisiones más rápidas de la misma página.
- Entrenado para citar fuentes en las respuestas.
- Uso: Añade la definición de la herramienta de navegación mediante
.with_browser()o.with_tools()en la solicitudsystem. - Nota: La implementación de referencia es solo para fines educativos: usa tu propio backend en producción.
2. Herramienta de Python
- Propósito: Realizar cálculos o ejecutar programas pequeños como parte de la cadena de pensamiento.
- Características:
- Entrenado con una herramienta de Python con estado para razonamiento de varios pasos.
- La implementación de referencia usa un modo sin estado.
- Puede anular las descripciones de herramientas predeterminadas en
openai‑harmony.
- Uso: Añade mediante
.with_python()o.with_tools()en la solicitudsystem. - Advertencia de seguridad: El código de referencia se ejecuta en un contenedor Docker permisivo: añade tus propias restricciones en producción.
3. Herramienta de aplicación de parches
- Propósito: Crear, actualizar o eliminar archivos locales.
- Caso de uso: Modificar archivos de código o de proyecto como parte de un bucle de desarrollo automatizado.
¿Cómo usar GPT OSS en Trae?
Requisitos previos: Obtén la clave de API
Novita AI proporciona APIs de GPT-OSS 120B con contexto de 131K y costes de $0.1/entrada y $0.5/salida. Novita AI también proporciona GPT-OSS 20B con contexto de 131 y costes de $0.05/entrada y $0.2/salida, ofreciendo un fuerte apoyo para maximizar el potencial del agente de código de GPT OSS.
Novita AI
Paso 1: Inicia sesión y accede a la biblioteca de modelos
Inicia sesión en tu cuenta y haz clic en el botón Biblioteca de modelos.

Paso 2: Elige tu modelo
Explora las opciones disponibles y selecciona el modelo que se adapte a tus necesidades.

Paso 3: Inicia tu prueba gratuita
Comienza tu prueba gratuita para explorar las capacidades del modelo seleccionado.

Paso 4: Obtén tu clave de API
Para autenticarte con la API, te proporcionaremos una nueva clave de API. Entrando en la página de “Ajustes”, puedes copiar la clave de API como se indica en la imagen.

¡Obtén tu clave de API de Novita AI!
Paso 5: Instala la API
Instala la API usando el gestor de paquetes específico de tu lenguaje de programación.
Después de la instalación, importa las librerías necesarias en tu entorno de desarrollo. Inicializa la API con tu clave de API para empezar a interactuar con el LLM de Novita AI. Este es un ejemplo de uso de la API de finalización de chat para usuarios de Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Usa GPT‑OSS en TRAE
Paso 1: Abre Trae y accede a los modelos
Abre la aplicación Trae. Haz clic en el botón de alternar la barra lateral de IA en la esquina superior derecha para abrir la Barra lateral de IA. Luego, ve a Gestión de IA y selecciona Modelos.


Paso 2: Añade un modelo personalizado, elige Novita como proveedor y selecciona los modelos
Haz clic en el botón Añadir modelo para crear una entrada de modelo personalizada. En el diálogo de añadir modelo, selecciona Proveedor = Novita en el menú desplegable.
En el menú desplegable de Modelo, elige el modelo que desees (DeepSeek-R1-0528, Kimi K2, GLM 4.5, DeepSeek-V3-0324 o MiniMax-M1-80k). Si el modelo exacto no aparece en la lista, simplemente escribe el ID del modelo que anotaste de la biblioteca de Novita. Asegúrate de elegir la variante correcta del modelo que quieres usar.


Paso 3: Introduce tu clave de API
Copia la clave de API de Novita AI de tu consola de Novita y pégala en el campo Clave de API de Trae.

¡Obtén tu clave de API de Novita AI!
Limitaciones de GPT OSS
| Característica | GPT-OSS (Modelo autoalojado) | API de GPT-5 (Plataforma gestionada) |
|---|---|---|
| Oferta principal | Un modelo en bruto (el “motor”) | Una plataforma completa e integrada (el “coche”) |
| Capacidad del modelo | Potente, pero una generación por detrás | Razonamiento de última generación, insignia |
| Herramientas integradas | Ninguna. Requiere un esfuerzo de bricolaje masivo. | Totalmente gestionadas: Búsqueda web, búsqueda de archivos, intérprete de código. |
| Ventana de contexto | Limitada prácticamente por tu hardware (por ejemplo, 8k-32k) | Masiva (400k), totalmente gestionada. |
| Framework de agentes | Bricolaje con librerías de código abierto. Sin observabilidad. | SDK integrado con observabilidad incorporada. |
| Funciones empresariales | Ninguna. Sin cumplimiento normativo, SSO o controles de administración. | Suite completa: SOC 2, HIPAA, RBAC, SSO, etc. |
| Soporte | Basado en la comunidad y autoservicio. | Equipo de cuenta dedicado y soporte prioritario. |
| Mantenimiento | Tu responsabilidad total. Configuración, escalado, tiempo de actividad. | Cero. Gestionado íntegramente por OpenAI. |
Integrar GPT‑OSS con TRAE ofrece lo mejor de ambos mundos:
- GPT‑OSS es el “cerebro”, controlado mediante el formato Harmony para ajustar la profundidad de razonamiento, estructurar las salidas y ocultar o mostrar los procesos de pensamiento.
- TRAE es el “cuerpo”, que ofrece un espacio de trabajo integrado, conexiones de herramientas y gestión autónoma del ciclo de vida del software, especialmente en el Modo SOLO.
- Novita AI cierra la brecha, alojando GPT‑OSS para que puedas usarlo mediante API sin hardware caro.
Esta combinación permite a los desarrolladores construir un “Ingeniero de IA” personalizado que comprende sus requisitos y los ejecuta exactamente como se pretende, haciendo posible la entrega de software verdaderamente autónoma.
Preguntas frecuentes
¿Por qué usar GPT‑OSS con TRAE en lugar de un modelo de API de código cerrado?
Obtienes control total. El formato Harmony permite a TRAE controlar la profundidad de razonamiento, el formato de salida y si se muestra el proceso de pensamiento. También puedes ajustar GPT‑OSS (fine-tuning) con tu propio código para una adaptación perfecta.
¿Necesito alojar GPT‑OSS yo mismo?
No. Servicios como Novita AI lo alojan por ti y te dan una clave de API, por lo que no necesitas GPUs caros ni una configuración compleja.
¿Qué es el formato Harmony y por qué es importante?
Es un formato de mensaje especial que entiende GPT‑OSS. Hace que las salidas sean estables, estructuradas y fáciles de procesar para TRAE: no se necesita un análisis frágil.
Novita AI es la plataforma cloud todo en uno que potencia tus ambiciones de IA. APIs integradas, sin servidor, instancias de GPU: las herramientas económicas que necesitas. Elimina la infraestructura, empieza gratis y haz realidad tu visión de IA.
Lecturas recomendadas
Qwen 3 en pipelines RAG: Modelos todo en uno de LLM, embedding y reranking
Trae o Claude Code: ¿Cuál es más adecuado para usar con Kimi K2?
