Использование GPT‑OSS в TRAE: Раскрытие формата Harmony для разработки с ИИ

Использование GPT‑OSS в TRAE: Раскрытие формата Harmony для разработки с ИИ

Разработка программного обеспечения с использованием ИИ развивается стремительно, и этому способствуют два ключевых тренда: появление мощных открытых моделей и полноценно интегрированных сред разработки с ИИ. GPT‑OSS — это серия открытых моделей от OpenAI, известная своим мощным логическим выводом, возможностями, аналогичными агентам, и глубокой возможностью кастомизации. TRAE от ByteDance — это IDE с ИИ, созданная для выполнения роли полноценного «ИИ-инженера», который может самостоятельно создавать программное обеспечение.

Вопрос в том, что получится, если объединить управляемую мощность логического вывода GPT‑OSS с богатой инструментами автоматизированной платформой разработки TRAE? Вместе они создают рабочий процесс, который является как автоматизированным, так и полностью адаптированным под ваши конкретные потребности. В этом руководстве объясняется, как их соединить и раскрыть их полный потенциал.

Что такое Trae?

TRAE — это также название IDE с поддержкой ИИ, созданной компанией ByteDance. Она разработана для выполнения роли «ИИ-инженера», который может самостоятельно создавать программные решения, понимая сложные задачи и выполняя их. TRAE призвана оптимизировать рабочий процесс разработки, позволяя пользователям делегировать задачи ИИ.

trae

Ключевые функции Trae

Улучшенная интеграция с инструментами и возможности (Протокол контекста модели — MCP)

  • Интеграция с внешними инструментами: TRAE поддерживает интеграцию с различными внешними инструментами, что позволяет ИИ-агентам использовать их для более эффективного выполнения задач.
  • Поддержка MCP: В TRAE реализован Протокол контекста модели (MCP) — открытый стандарт для подключения ИИ-приложений к внешним источникам данных и инструментам. Он работает как универсальный порт «USB-C» для ИИ, решая проблему подключения ИИ-моделей к изолированным данным.
  • Расширенные возможности ИИ: Через MCP агенты могут получать доступ к внешним ресурсам, таким как Google Диск, Slack, GitHub и базы данных, чтобы лучше понимать и выполнять сложные задачи.

Более глубокое понимание контекста и точный контроль

  • Глубокое понимание контекста разработки: TRAE полностью понимает ваш контекст разработки, включая репозитории кода, результаты онлайн-поиска и общие документы.
  • Точная настройка поведения: Вы можете настроить правила, чтобы адаптировать поведение ИИ под ваш рабочий процесс, гарантируя, что он выполняет задачи именно так, как вы задумали.
  • Мультимодальное взаимодействие: Поддерживается загрузка изображений (например, макетов дизайна, скриншотов ошибок) для описания требований, что позволяет ИИ генерировать более точный код.

CUE: Умное предсказание и редактирование в одно нажатие

  • Предсказание следующего редактирования: Функция CUE (Движок понимания контекста) понимает ваши намерения и предсказывает ваше следующее действие, анализируя ваше поведение при редактировании.
  • Навигация и применение в одно нажатие: Достаточно нажать клавишу Tab, чтобы перейти к следующему предложенному изменению или применить умные предложения сразу к нескольким строкам.
  • Непрерывная оптимизация: Функция постоянно оптимизируется для повышения производительности и отзывчивости, что обеспечивает более плавный опыт при изменении кода, его генерации и исправлении ошибок.

Полноценные функции IDE и помощь ИИ

  • Два режима разработки: Доступен режим IDE для традиционного рабочего процесса под контролем пользователя и режим SOLO, в котором ИИ руководит разработкой от формирования требований до сдачи готового продукта для полной автоматизации.
  • Полноценная IDE: Предоставляет стандартные функции IDE, такие как редактирование кода, управление проектами и контроль версий.
  • Помощь в программировании с ИИ: Включает различные функции помощи на основе ИИ, включая умное автодополнение кода, рефакторинг, ответы на вопросы в чате и генерацию проектов на основе естественного языка.
  • Встроенный предпросмотр веб-страниц: Поддерживается прямой предпросмотр веб-страниц внутри IDE для упрощения фронтенд-разработки и отладки.

Что такое Trae Solo?

What is Trae Solo?

  • Единое рабочее пространство и хаб ИИ-инструментов:
    В режиме SOLO все необходимые инструменты разработки — IDE, браузер, терминал и документы — интегрированы непосредственно в ИИ. Это позволяет ИИ точно рассуждать и действовать, исходя из конкретных потребностей каждой задачи, бесшовно сокращая разрыв между идеей и её реализацией.
  • Разработка под руководством ИИ от начала до конца:
    Достаточно предоставить требования, и SOLO автономно управляет всем жизненным циклом разработки, включая:
    • Анализ требований
    • Прототипирование
    • Фронтенд-разработка
    • Бэкенд-разработка
    • Отладка и оптимизация
    • Сборка и деплой
  • Единый вид для мониторинга:
    Пользователи могут общаться с ИИ и отслеживать все этапы разработки из единого унифицированного представления. «Расширенный вид» позволяет детально просматривать все детали выполнения в реальном времени.
  • Мультимодальное взаимодействие: «Говорите» свои требования:
    Режим SOLO поддерживает голосовой ввод, что позволяет взаимодействовать с TRAE так же естественно, как с человеческим коллегой. Выходные данные ИИ не ограничиваются кодом: расширяемое динамическое представление справа обеспечивает визуальную и интуитивно понятную обратную связь.
  • «Инженер контекста»:
    Режим SOLO разработан как ultimate «Инженер контекста», способный понимать полный объём вашей работы, чтобы его действия и выходные данные основывались на наиболее полной и точной доступной информации.

Таким образом, цель режима TRAE SOLO — обеспечить работу «ИИ, который выпускает полноценное программное обеспечение». Он даёт разработчикам возможность быстрее создавать и выпускать реальное программное обеспечение через простой процесс «Поговори. Подумай. Выпусти».

Что такое GPT OSS?

GPT-OSS (Open-Source Series) — это семейство мощных открытых языковых моделей от OpenAI, предназначенных для свободного коммерческого использования и возможности запуска локально на потребительском оборудовании. Серия включает две основные модели с 20 и 120 миллиардами параметров, оптимизированные для мощного логического вывода, использования инструментов и эффективности, что знаменует значительный шаг OpenAI в сторону большей прозрачности в сообществе ИИ. Эти модели позволяют разработчикам и исследователям дообучать их для пользовательских целей с полным контролем над своими данными и инфраструктурой, сокращая разрыв между закрытыми проприетарными системами и открытым ИИ.

Модель Количество слоёв Общее количество параметров Активные параметры на токен Общее количество экспертов Активные эксперты на токен Длина контекста Требования к объему видеопамяти одной GPU
gpt-oss-120b 36 117B 5.1B 128 4 128k 80GB
gpt-oss-20b 24 21B 3.6B 32 4 128k 16GB

gpt oss benchmark

Почему стоит выбрать GPT OSS для разработки с ИИ?

Настройка формата: Harmony

Модели GPT‑OSS используют специальный формат диалогов, называемый Harmony. Этот формат организует сообщения по чётким ролям — system, user и assistant — и позволяет вам контролировать, как модель рассуждает и отвечает. С помощью Harmony вы можете настроить глубину логического вывода (низкая, средняя, высокая), решить, показывать ли процесс рассуждений или скрывать его, и заставить модель вызывать функции стабильным структурированным способом. Многие другие открытые модели не имеют таких встроенных средств управления, но GPT‑OSS понимает их нативно, поскольку была обучена следовать инструкциям Harmony. Это упрощает получение стабильных, надёжных и удобных для работы с инструментами выходных данных.

Что можно контролировать с помощью Harmony

Формат Harmony позволяет настраивать несколько ключевых параметров поведения для моделей GPT‑OSS:

Параметр Описание Пример
Глубина логического вывода Контролирует, насколько подробно модель выполняет пошаговое рассуждение. "Reasoning: low", "Reasoning: medium", "Reasoning: high"
Вызов функций Нативная поддержка вывода в формате JSON в стиле OpenAI function_call / tool_calls. "Always call function weather_api when asked about weather"
Видимость рассуждений Показывать или скрывать полную цепочку рассуждений в тегах <think>. "Show reasoning" / "Hide reasoning"
Правила формата выходных данных Принудительный структурированный вывод, например в формате JSON, Markdown и т.д. "Output in JSON format"

Пример запроса в формате Harmony

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Explain how quicksort works."
    }
  ]
}

Преимущества использования Harmony с инструментами вроде Trae

При интеграции с платформами генерации кода, отладки и выполнения, такими как Trae, формат Harmony предоставляет несколько практических преимуществ:

  1. Стабильный структурированный вывод
    • Harmony гарантирует, что выходные данные модели соответствуют предсказуемому формату JSON или блока кода.
    • Trae может напрямую парсить такие данные без хрупких регулярных выражений или постобработки.
  2. Контроль глубины логического вывода
    • Используйте низкую глубину вывода для быстрого прототипирования или простого кода.
    • Используйте высокую глубину вывода для сложных алгоритмов, где корректность имеет первостепенное значение.
    • Экономит ресурсы GPU/CPU, подстраивая стоимость вычислений под сложность задачи.
  3. Переключение видимости рассуждений
    • Показывайте рассуждения в тегах <think> для отладки и обучения.
    • Скрывайте рассуждения в продакшене, чтобы сократить количество токенов и избежать утечки внутренней логики.
  4. Чёткое управление контекстом в многоходовом диалоге
    • Правила из system-сообщения сохраняются между ходами диалога, обеспечивая единый стиль кода и правила выполнения.
    • Простая итерация: изменяйте пользовательские инструкции без потери глобальных настроек.
  5. Бесшовная интеграция с API
    • Harmony имитирует API ответов OpenAI, поэтому любой инструментарий или плагин IDE, совместимый с OpenAI, будет работать с GPT‑OSS с минимальными изменениями.

Использование инструментов GPT OSS

Модели GPT‑OSS обучены нативно использовать внешние инструменты в рамках процесса рассуждений, с встроенной поддержкой веб-поиска, выполнения кода на Python и наложения патчей на файлы. Эти инструменты активируются путём их определения в system-сообщении промпта в формате Harmony.

1. Инструмент веб-поиска

  • Назначение: Поиск информации в интернете, открытие страниц и поиск текста на них.
  • Методы:
    • search — поиск по ключевым фразам.
    • open — открытие конкретной страницы.
    • find — поиск контента на странице.
  • Возможности:
    • Прокручиваемое текстовое окно для управления размером контекста.
    • Кэширование для ускорения повторных посещений одной и той же страницы.
    • Обучен указывать источники в ответах.
  • Использование: Добавьте определение инструмента веб-поиска через .with_browser() или .with_tools() в system-промпт.
  • Примечание: Эталонная реализация предназначена только для образовательных целей — в продакшене используйте собственный бэкенд.

2. Инструмент Python

  • Назначение: Выполнение вычислений или запуск небольших программ в рамках цепочки рассуждений.
  • Возможности:
    • Обучен с использованием stateful-инструмента Python для многошагового рассуждения.
    • Эталонная реализация использует режим stateless (без сохранения состояния).
    • Можно переопределять стандартные описания инструментов в openai‑harmony.
  • Использование: Добавьте через .with_python() или .with_tools() в system-промпт.
  • Предупреждение о безопасности: Эталонный код выполняется в разрешающем контейнере Docker — добавьте собственные ограничения в продакшене.

3. Инструмент наложения патчей

  • Назначение: Создание, обновление или удаление локальных файлов.
  • Сценарий использования: Изменение кода или файлов проекта в рамках автоматизированного цикла разработки.

Как использовать GPT OSS в Trae?

Предварительные требования: Получение API-ключа

Novita AI предоставляет API для GPT-OSS 120B с контекстом 131K и стоимостью $0.1/ввод и $0.5/вывод. Novita AI также предоставляет GPT-OSS 20B с контекстом 131K и стоимостью $0.05/ввод и $0.2/вывод, что обеспечивает мощную поддержку для максимизации потенциала код-агента GPT OSS.

Novita AI

Шаг 1: Вход в аккаунт и доступ к библиотеке моделей

Войдите в свой аккаунт и нажмите кнопку Библиотека моделей.

Log In and Access the Model Library

Попробуйте GPT OSS сейчас!

Шаг 2: Выбор модели

Просмотрите доступные варианты и выберите модель, подходящую для ваших задач.

Step 2: Choose Your Model

Шаг 3: Запуск бесплатного пробного периода

Начните бесплатный пробный период, чтобы изучить возможности выбранной модели.

Step 3: Start Your Free Trial

Шаг 4: Получение API-ключа

Для аутентификации через API мы предоставим вам новый API-ключ. Перейдя на страницу «Настройки», вы можете скопировать API-ключ, как показано на изображении.

get api key

Получите API-ключ Novita AI!

Шаг 5: Установка API

Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования.

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с LLM Novita AI. Ниже приведён пример использования API завершения чата для пользователей Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

Использование GPT‑OSS в TRAE

Шаг 1: Открытие Trae и доступ к моделям

Запустите приложение Trae. Нажмите кнопку переключения ИИ-боковой панели в правом верхнем углу, чтобы открыть ИИ-боковую панель. Затем перейдите в Управление ИИ и выберите Модели.

Toggle AI Side Bar

go to AI Management and select Models

Шаг 2: Добавление пользовательской модели, выбор Novita в качестве провайдера и выбор модели

Нажмите кнопку Добавить модель, чтобы создать запись пользовательской модели. В диалоговом окне добавления модели выберите Провайдер = Novita в выпадающем меню.

В выпадающем меню Модели выберите нужную вам модель (DeepSeek-R1-0528, Kimi K2, GLM 4.5, DeepSeek-V3-0324 или MiniMax-M1-80k). Если точная модель отсутствует в списке, просто введите идентификатор модели, который вы записали из библиотеки Novita. Убедитесь, что вы выбрали правильный вариант нужной вам модели.

Add a Custom Model

Choose Novita as Prov

Шаг 3: Ввод API-ключа

Скопируйте API-ключ Novita AI из вашей консоли Novita и вставьте его в поле API-ключа в Trae.

get api key

Получите API-ключ Novita AI!

Ограничения GPT OSS

Функция GPT-OSS (самостоятельно размещаемая модель) GPT-5 API (управляемая платформа)
Основное предложение Готовая модель («двигатель») Полноценная интегрированная платформа («автомобиль»)
Возможности модели Мощные, но на одно поколение отстают от флагманских Лучшие в отрасли, флагманское логическое вывод
Встроенные инструменты Отсутствуют. Требуют значительных самостоятельных усилий для реализации. Полностью управляемые: Веб-поиск, поиск по файлам, интерпретатор кода.
Окно контекста Практически ограничено возможностями вашего оборудования (например, 8k-32k) Очень большое (400k), полностью управляемое.
Фреймворк для агентов Собственная реализация на основе открытых библиотек. Нет возможностей мониторинга. Интегрированный SDK со встроенными возможностями мониторинга.
Корпоративные функции Отсутствуют. Нет соответствия нормам, SSO или средств администрирования. Полный набор: SOC 2, HIPAA, RBAC, SSO и т.д.
Поддержка На основе сообщества и самостоятельное обслуживание. Выделенная команда аккаунт-менеджеров и приоритетная поддержка.
Обслуживание Полностью ваша ответственность. Настройка, масштабирование, время работы. Ноль затрат. Полностью обслуживается OpenAI.

Интеграция GPT‑OSS с TRAE сочетает лучшее из двух миров:

  • GPT‑OSS выступает «мозгом», которым можно управлять через формат Harmony, чтобы настраивать глубину логического вывода, структурировать выходные данные и скрывать или показывать процессы рассуждений.
  • TRAE выступает «телом», предоставляя интегрированное рабочее пространство, подключение к инструментам и автономное управление жизненным циклом программного обеспечения — особенно в режиме SOLO.
  • Novita AI закрывает разрыв, размещая GPT‑OSS за вас, чтобы вы могли использовать его через API без дорогостоящего оборудования.

Эта комбинация позволяет разработчикам создавать индивидуального «ИИ-инженера», который понимает их требования и выполняет их точно так, как задумано, что делает возможной действительно автономную поставку программного обеспечения.

Часто задаваемые вопросы

Почему стоит использовать GPT‑OSS с TRAE вместо модели через закрытый API?

Вы получаете полный контроль. Формат Harmony позволяет TRAE управлять глубиной логического вывода, форматом выходных данных и тем, показывать ли процесс рассуждений. Вы также можете дообучить GPT‑OSS на вашем собственном коде для идеального соответствия.

Нужно ли мне самостоятельно размещать GPT‑OSS?

Нет. Сервисы вроде Novita AI размещают его за вас и предоставляют API-ключ, поэтому вам не нужны дорогие GPU или сложная настройка.

Что такое формат Harmony и почему он важен?

Это специальный формат сообщений, который понимает GPT‑OSS. Он делает выходные данные стабильными, структурированными и лёгкими для обработки в TRAE — не требуется хрупкий парсинг.

Novita AI — это универсальная облачная платформа, которая помогает реализовать ваши амбиции в области ИИ. Интегрированные API, серверless, GPU-инстансы — доступные инструменты, которые вам нужны. Избавьтесь от необходимости управления инфраструктурой, начните бесплатно и воплотите ваше видение ИИ в реальность.

Рекомендуемые материалы для чтения

Qwen 3 в RAG-пайплайнах: универсальное решение с LLM, эмбеддингами и реранкинг-моделями

Trae или Claude Code: что лучше подходит для использования с Kimi K2?

Стоимость DeepSeek R1 0528: сравнение API, GPU и локального развертывания