Harbor es un marco de trabajo para evaluar y optimizar agentes y modelos de lenguaje. Está diseñado en torno a tareas de benchmark, entornos contenedorizados, pruebas paralelas y generación de despliegues para flujos de trabajo de optimización. Para los equipos que evalúan agentes de codificación o agentes que utilizan herramientas, el entorno de ejecución no es un detalle menor: determina cómo se construyen las tareas, cómo se ejecutan los comandos, cómo se mueven los archivos hacia adentro y hacia afuera, y cómo se recopilan los registros del verificador.
Este artículo analiza la ruta del código del entorno Novita en Harbor y cómo se asigna a Novita Agent Sandbox. El alcance es intencionalmente limitado: es una visión general orientada a la implementación, no un anuncio de asociación, no un benchmark y no una comparación de costos.
Qué necesita Harbor de un sandbox en la nube
Las tareas de Harbor definen una instrucción, pruebas, lógica de solución opcional y un entorno. El entorno suele representarse mediante archivos en un directorio environment/. La documentación de tareas de Harbor explica que los archivos requeridos dependen del tipo de entorno seleccionado. Docker puede utilizar un Dockerfile o un archivo Compose, mientras que la mayoría de los proveedores de sandbox en la nube admiten entornos definidos por Dockerfile en lugar de Docker Compose.
Ese modelo es importante para las evaluaciones de agentes. Una ejecución de Harbor necesita crear un entorno de tarea aislado, ejecutar comandos del agente y del verificador, transferir archivos como pruebas y artefactos, y luego limpiar el tiempo de ejecución. Cuando una ejecución escala de unas pocas pruebas locales a muchas pruebas remotas, el proveedor de sandbox se convierte en parte del arnés de evaluación.
Dónde encaja Novita Agent Sandbox
Novita Agent Sandbox es un entorno de ejecución de sandbox en la nube para agentes de IA que ejecutan código generado. La documentación del producto describe un entorno sandbox seguro y aislado, soporte de ejecución multilenguaje, pausa/reanudación, ejecución en segundo plano y gestión mediante SDK/CLI. En el contexto de Harbor, la superficie de tiempo de ejecución relevante es práctica: crear un sandbox, ejecutar comandos, mover archivos y gestionar el ciclo de vida del sandbox.
El árbol fuente de Harbor incluye el código/ruta del entorno Novita en main, incluyendo un tipo de entorno novita, cableado de fábrica para harbor.environments.novita.NovitaEnvironment y cableado de dependencia opcional a nivel de fuente para Novita Agent Sandbox. Esto debe describirse como estado del árbol fuente, no como soporte liberado en PyPI.
Forma de integración
A alto nivel, la ruta del entorno Novita en Harbor asigna un entorno de tarea de Harbor a una plantilla de sandbox de Novita y una sesión de tiempo de ejecución:
- Harbor lee la definición del entorno de la tarea, generalmente desde un
environment/Dockerfile. - La implementación del entorno Novita construye o reutiliza una plantilla de sandbox de Novita para ese entorno.
- Harbor crea un sandbox a partir de la plantilla para la prueba de evaluación.
- Los comandos del agente, del verificador y de configuración se ejecutan dentro del sandbox.
- Los archivos se cargan y descargan del sandbox según lo requiera el ciclo de vida de la tarea de Harbor.
- El sandbox se detiene o limpia cuando la prueba se completa.
Esto es útil porque mantiene intacta la abstracción de evaluación de Harbor. Los autores de tareas siguen razonando en términos de Harbor: instrucciones, pruebas, archivos de recompensa, artefactos y archivos de entorno. El proveedor de sandbox maneja el entorno de ejecución remota detrás de esa interfaz.
Estado actual de la versión
El árbol fuente de Harbor incluye el código/ruta del entorno Novita en main. Eso incluye código fuente para un tipo de entorno novita, una implementación de NovitaEnvironment y cableado de dependencia opcional a nivel de fuente para Novita Agent Sandbox. Por ahora, trátalo como una guía del árbol fuente, no como un inicio rápido ejecutable de PyPI.
Según la verificación actual de la publicación, la versión 0.7.0 de Harbor en PyPI no incluye el extra novita, no instala novita-sandbox a través de un extra Novita de Harbor, y no expone novita como un valor válido de entorno CLI. No publiques comandos que pidan a los lectores instalar un extra Novita de Harbor o ejecutar Harbor con un entorno CLI Novita contra el paquete PyPI hasta que haya una versión de Harbor que contenga esta interfaz.
La guía segura para los lectores es: el árbol fuente de Harbor incluye el código/ruta del entorno Novita en main, mientras que el paquete PyPI publicado aún no ha incluido esa interfaz. Una vez que Harbor publique una versión que incluya el extra Novita y el entorno CLI, este artículo se podrá actualizar con comandos de instalación y ejecución probados.
Un modelo mental mínimo de tarea
Una tarea de Harbor generalmente incluye:
instruction.mdpara la tarea orientada al agente.task.tomlpara metadatos de la tarea y configuración del tiempo de ejecución.environment/para la definición del entorno contenedor.tests/para la lógica del verificador.- Un directorio opcional
solution/para flujos de trabajo de oráculo o verificación de cordura.
Para un proveedor de sandbox en la nube, mantén la definición del entorno portátil. La documentación de Harbor señala que la mayoría de los proveedores de sandbox en la nube solo admiten entornos definidos por Dockerfile, por lo que una tarea basada en Docker Compose debe revisarse antes de asumir que puede ejecutarse de forma remota.
Lo que esto no afirma
Esta ruta de integración debe describirse con precisión. Las afirmaciones actuales respaldadas por código fuente público se refieren al estado a nivel de código en Harbor main y a las capacidades del producto Novita Agent Sandbox, no a afirmaciones comerciales o de benchmark. Evita decir que Novita y Harbor han anunciado una asociación oficial a menos que exista un anuncio público. Evita decir que la ruta Novita es más rápida, más económica o más fiable que otros proveedores de entorno de Harbor a menos que exista un benchmark o una comparación de precios que citar. Evita implicar que la documentación pública de Harbor recomienda actualmente a Novita como proveedor predeterminado en la nube.
La declaración publicable más sólida es más estrecha y más útil: el árbol fuente de Harbor incluye el código/ruta del entorno Novita en main, y Novita Agent Sandbox proporciona primitivas de tiempo de ejecución de sandbox que necesita un entorno de evaluación de Harbor: ejecución aislada, ejecución de comandos, operaciones de archivos, configuración basada en plantillas y gestión del ciclo de vida.
Cómo usar esto hoy
Usa este artículo como una visión general arquitectónica y una nota de estado de la versión, no como un inicio rápido de copiar y pegar. Si estás evaluando Harbor hoy desde el paquete PyPI actual, verifica la versión instalada de Harbor y la ayuda CLI antes de asumir que el entorno Novita está disponible. Si la versión instalada no expone el extra Novita o el entorno CLI, espera a una versión de Harbor que incluya esa interfaz antes de publicar comandos ejecutables o agregar la ruta a la documentación de evaluación de producción.
Para la publicación final de Novita, se pueden agregar bloques de comandos probados después de que Harbor publique una versión que contenga el extra Novita y el entorno CLI. Hasta entonces, el artículo debe mantener el límite claro: Harbor main contiene la ruta de código del entorno Novita, mientras que los usuarios actuales de PyPI no deben ser dirigidos a ejecutar comandos de Harbor específicos de Novita.
Preguntas frecuentes
¿Harbor soporta Novita Agent Sandbox?
La rama main de Harbor incluye una ruta de entorno Novita que asigna los entornos de evaluación de Harbor a Novita Agent Sandbox. Trátalo como soporte a nivel de árbol fuente hasta que una versión de Harbor incluya el extra Novita y el entorno CLI.
¿Puedo instalar Harbor con soporte Novita desde PyPI hoy?
No desde la versión actual verificada de PyPI. El último paquete de Harbor comprobado, harbor 0.7.0, no incluye el extra Novita ni la implementación del entorno Novita, por lo que este artículo no lo presenta como una ruta de instalación lista para ejecutar.
¿Por qué no hay comandos ejecutables de Harbor en este artículo?
Los comandos ejecutables implicarían que la ruta Novita está disponible en el paquete publicado de Harbor. Hasta que el paquete y la superficie CLI se publiquen y prueben, la guía más segura es explicar la forma de la integración y el límite actual de la versión.
¿Qué cambia después de que Harbor publique soporte para Novita?
Después de que Harbor publique una versión con el extra Novita y el entorno CLI, este artículo debe actualizarse a un inicio rápido práctico con pasos de instalación verificados, variables de entorno, un ejemplo de tarea basada en Dockerfile y la salida de validación esperada.
Fuentes
- README de Harbor
- Implementación del entorno Novita en Harbor
- Código fuente del tipo de entorno de Harbor
- Fábrica de entornos de Harbor
- Dependencias opcionales de Harbor
- Documentación de tareas/entorno de Harbor
- Visión general de Novita Agent Sandbox
- Documentación del SDK/CLI de Novita Agent Sandbox
- Inicio rápido del primer sandbox de Novita
- Documentación de compatibilidad E2B de Novita
