TRAE에서 GPT‑OSS 사용하기: AI 코딩을 위한 Harmony 포맷 활용

TRAE에서 GPT‑OSS 사용하기: AI 코딩을 위한 Harmony 포맷 활용

AI 기반 소프트웨어 개발은 강력한 오픈소스 모델과 완전 통합된 AI 개발 환경이라는 두 가지 큰 트렌드에 힘입어 빠르게 발전하고 있습니다. **GPT‑OSS**는 OpenAI의 오픈웨이트 모델 시리즈로, 강력한 추론 능력, 에이전트와 유사한 기능, 그리고 깊은 커스터마이징으로 유명합니다. TRAE는 바이트댄스(ByteDance)에서 만든 AI IDE로, 스스로 소프트웨어를 구축할 수 있는 완전한 “AI 엔지니어” 역할을 하도록 설계되었습니다.

문제는 다음과 같습니다: GPT‑OSS의 제어 가능한 추론 능력과 TRAE의 도구가 풍부한 자동 개발 프레임워크를 결합하면 어떤 일이 발생할까요? 두 도구를 함께 사용하면 자동화되면서도 사용자의 정확한 요구에 맞춘 워크플로우가 만들어집니다. 이 가이드에서는 두 도구를 연결하고 잠재력을 최대한 발휘하는 방법을 설명합니다.

TRAE란 무엇인가?

TRAE는 바이트댄스(ByteDance)에서 만든 AI 기반 통합 개발 환경(IDE)의 이름이기도 합니다. 복잡한 작업을 이해하고 실행하여 독립적으로 소프트웨어 솔루션을 구축할 수 있는 "AI 엔지니어"로 기능하도록 설계되었습니다. TRAE는 사용자가 AI에 작업을 위임하여 개발 워크플로우를 간소화하는 것을 목표로 합니다.

trae

TRAE의 주요 기능

향상된 도구 통합 및 기능 (모델 컨텍스트 프로토콜 - MCP)

  • 외부 도구 통합: TRAE는 다양한 외부 도구와 통합되어 AI 에이전트가 더 효과적으로 작업을 실행할 수 있도록 지원합니다.
  • MCP 지원: AI 애플리케이션을 외부 데이터 소스 및 도구와 연결하기 위한 오픈 표준인 모델 컨텍스트 프로토콜(MCP)을 지원합니다. 이는 AI의 범용 “USB-C” 포트처럼 작동하여 AI 모델을 사일로화된 데이터에 연결하는 문제를 해결합니다.
  • 확장된 AI 기능: MCP를 통해 에이전트는 Google Drive, Slack, GitHub, 데이터베이스 등 외부 리소스에 액세스하여 복잡한 작업을 더 잘 이해하고 완료할 수 있습니다.

심층 컨텍스트 이해 및 정밀 제어

  • 개발 컨텍스트의 깊은 이해: TRAE는 코드 저장소, 온라인 검색 결과, 공유 문서를 포함한 개발 컨텍스트를 깊이 이해합니다.
  • 정밀한 동작 커스터마이징: 규칙을 사용자 정의하여 AI의 동작을 워크플로우에 맞게 조정할 수 있어, AI가 의도한 대로 정확하게 작업을 실행하도록 보장합니다.
  • 멀티모달 상호작용: 디자인 목업, 오류 스크린샷 등의 이미지 업로드를 지원하여 요구사항을 설명할 수 있으므로, AI가 더 정확한 코드를 생성할 수 있습니다.

CUE: 스마트 예측 및 원클릭 편집

  • 다음 편집 예측: CUE(컨텍스트 이해 엔진) 기능은 사용자의 의도를 이해하고 편집 동작을 분석하여 다음 작업을 예측합니다.
  • 원클릭 탐색 및 적용: Tab 키를 누르기만 하면 다음 제안된 변경 사항으로 이동하거나 여러 줄에 걸쳐 스마트 제안을 한 번에 적용할 수 있습니다.
  • 지속적인 최적화: 이 기능은 성능과 응답성을 지속적으로 최적화하여 코드 수정, 생성, 버그 수정 시 더 원활한 경험을 제공합니다.

포괄적인 IDE 기능 및 AI 지원

  • 이중 개발 모드: 전통적인 사용자 제어 워크플로우를 위한 IDE 모드와, AI가 요구사항부터 전달까지 개발을 주도하는 SOLO 모드를 제공합니다.
  • 완전한 기능의 IDE: 코드 편집, 프로젝트 관리, 버전 관리 등 표준 IDE 기능을 제공합니다.
  • AI 프로그래밍 지원: 스마트 코드 완성, 리팩토링, 채팅 기반 Q&A, 자연어에서 프로젝트 생성 등 다양한 AI 기반 지원 기능을 제공합니다.
  • 내장 웹 미리보기: IDE 내에서 웹 페이지를 직접 미리보기 지원하여 프론트엔드 개발 및 디버깅을 더 쉽게 할 수 있습니다.

TRAE 솔로 모드란 무엇인가?

What is Trae Solo?

  • 통합 작업 공간 및 AI 도구 허브:
    SOLO 모드는 IDE, 브라우저, 터미널, 문서 등 모든 필요한 개발 도구를 AI에 직접 통합합니다. 이를 통해 AI는 각 작업의 특정 요구에 따라 정밀하게 추론하고 행동할 수 있어, 아이디어에서 실행까지의 격차를 원활하게 연결합니다.
  • AI 주도의 엔드투엔드 개발:
    요구사항만 제공하면 SOLO가 요구사항 분석, 프로토타이핑, 프론트엔드 개발, 백엔드 개발, 디버깅 및 최적화, 빌드 및 배포를 포함한 전체 개발 수명 주기를 자율적으로 처리합니다.
  • 통합 모니터링 뷰:
    사용자는 AI와 채팅하고 단일 통합 뷰에서 모든 개발 활동을 모니터링할 수 있습니다. "확장 뷰"는 모든 실시간 실행 세부 정보를 자세히 보여줍니다.
  • 멀티모달 상호작용: 음성으로 요구사항 전달:
    SOLO 모드는 음성 입력을 지원하여 인간 팀원과 자연스럽게 대화하듯 TRAE와 상호작용할 수 있습니다. AI의 출력은 코드로 제한되지 않으며, 오른쪽의 확장 가능한 동적 뷰는 시각적이고 직관적인 피드백을 제공합니다.
  • 컨텍스트 엔지니어:
    SOLO 모드는 궁극적인 "컨텍스트 엔지니어"로 설계되어, 작업의 전체 범위를 이해하여 작업과 출력이 가장 포괄적이고 정확한 정보를 기반으로 이루어지도록 보장합니다.

요약하자면, TRAE SOLO 모드의 목표는 "완전한 소프트웨어를 출시하는 AI"를 가능하게 하는 것입니다. 간단한 “Talk. Think. Ship.” 프로세스를 통해 개발자가 실제 소프트웨어를 더 빠르게 구축하고 출시할 수 있도록 지원합니다.

GPT OSS란 무엇인가?

GPT-OSS(오픈소스 시리즈)는 OpenAI에서 출시한 강력한 오픈웨이트 언어 모델 제품군으로, 상업적 사용을 위해 무료로 사용할 수 있으며 소비자 하드웨어에서 로컬로 실행할 수 있도록 설계되었습니다. 이 시리즈에는 200억 및 1200억 매개변수 버전의 두 가지 주요 모델이 포함되어 있으며, 강력한 추론, 도구 사용 및 효율성에 최적화되어 있어 OpenAI가 AI 커뮤니티에서 더 큰 투명성을 향해 전환하는 중요한 변화를 나타냅니다. 이러한 모델을 통해 개발자와 연구자는 자체 데이터와 인프라를 완전히 제어하면서 맞춤 목적으로 미세 조정할 수 있어, 폐쇄형 독점 시스템과 오픈소스 AI 간의 격차를 해소합니다.

모델 레이어 수 총 매개변수 수 토큰당 활성 매개변수 수 총 전문가 수 토큰당 활성 전문가 수 컨텍스트 길이 단일 GPU VRAM 요구 사항
gpt-oss-120b 36 117B 5.1B 128 4 128k 80GB
gpt-oss-20b 24 21B 3.6B 32 4 128k 16GB

gpt oss benchmark

AI 코드 작성을 위해 GPT OSS를 선택해야 하는 이유?

포맷 커스터마이징: Harmony

GPT‑OSS 모델은 Harmony라는 특별한 대화 포맷을 사용합니다. 이 포맷은 메시지를 system, user, assistant의 명확한 역할로 구성하며, 모델이 생각하고 응답하는 방식을 제어할 수 있게 해줍니다. Harmony를 사용하면 추론 깊이(낮음, 중간, 높음)를 조정하고, 생각 과정을 표시할지 숨길지 결정하며, 모델이 안정적이고 구조화된 방식으로 함수를 호출하도록 할 수 있습니다. 다른 많은 오픈소스 모델에는 이러한 제어 기능이 내장되어 있지 않지만, GPT‑OSS는 Harmony 지시를 따르도록 훈련되었기 때문에 이러한 기능을 기본적으로 이해합니다. 이를 통해 일관되고 신뢰할 수 있으며 도구 친화적인 출력을 쉽게 얻을 수 있습니다.

Harmony가 제어할 수 있는 항목

Harmony 포맷을 사용하면 GPT‑OSS 모델의 몇 가지 주요 동작 매개변수를 조정할 수 있습니다:

매개변수 설명 예시
추론 깊이 모델이 단계별로 생각하는 정도를 제어합니다. "Reasoning: low", "Reasoning: medium", "Reasoning: high"
함수 호출 OpenAI 스타일의 function_call / tool_calls JSON 출력을 기본 지원합니다. "Always call function weather_api when asked about weather"
추론 표시 여부 <think> 태그 내 전체 사고 과정을 표시하거나 숨깁니다. "Show reasoning" / "Hide reasoning"
출력 포맷 규칙 JSON, Markdown 등 구조화된 출력을 강제합니다. "Output in JSON format"

Harmony 요청 예시

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Explain how quicksort works."
    }
  ]
}

Trae와 같은 도구와 Harmony를 함께 사용할 때의 이점

코드 생성, 디버깅 및 실행 플랫폼인 Trae와 통합할 때 Harmony 포맷은 몇 가지 실용적인 이점을 제공합니다:

  1. 안정적인 구조화된 출력
    • Harmony는 모델의 출력이 예측 가능한 JSON 또는 코드 블록 포맷을 따르도록 보장합니다.
    • Trae는 취약한 정규식이나 후처리 없이 이 출력을 직접 파싱할 수 있습니다.
  2. 추론 깊이 제어
    • 간단한 코드의 경우 낮음 추론을 사용하여 빠른 프로토타이핑을 수행합니다.
    • 정확성이 가장 중요한 복잡한 알고리즘의 경우 높음 추론을 사용합니다.
    • 추론 비용을 작업 복잡성에 맞춰 조정하여 GPU/CPU 리소스를 절약합니다.
  3. 추론 표시 여부 전환
    • 디버깅 및 학습을 위해 <think> 추론을 표시합니다.
    • 프로덕션에서 추론을 숨겨 토큰을 줄이고 내부 로직 유출을 방지합니다.
  4. 명확한 다중 턴 컨텍스트 관리
    • system 규칙은 턴 간에 지속되어 일관된 코드 스타일과 실행 규칙을 보장합니다.
    • 반복이 쉽습니다: 전역 설정을 잃지 않고 사용자 지시를 수정할 수 있습니다.
  5. 원활한 API 통합
    • Harmony는 OpenAI Responses API를 모방하므로, OpenAI와 호환되는 모든 도구 체인 또는 IDE 플러그인은 최소한의 변경으로 GPT‑OSS와 함께 작동할 수 있습니다.

GPT OSS 도구 사용

GPT‑OSS 모델은 추론 프로세스의 일부로 외부 도구를 기본적으로 사용하도록 훈련되어 있으며, 브라우징, Python 실행파일 패치에 대한 기본 지원을 제공합니다. 이러한 도구는 Harmony 형식의 프롬프트system 메시지에 정의하여 활성화합니다.

1. 브라우저 도구

  • 목적: 웹을 검색하고 페이지를 열며 페이지의 텍스트를 찾습니다.
  • 메서드:
    • search — 키워드를 검색합니다.
    • open — 특정 페이지를 엽니다.
    • find — 페이지에서 콘텐츠를 찾습니다.
  • 기능:
    • 컨텍스트 크기를 관리하기 위한 스크롤 가능한 텍스트 창.
    • 동일 페이지 재방문 시 더 빠른 캐싱.
    • 답변에서 출처를 인용하도록 훈련됨.
  • 사용법: system 프롬프트에서 .with_browser() 또는 .with_tools()를 통해 브라우저 도구 정의를 추가합니다.
  • 참고: 참조 구현은 교육용으로만 사용하세요. 프로덕션에서는 자체 백엔드를 사용하세요.

2. Python 도구

  • 목적: 사고 과정의 일부로 계산을 수행하거나 소규모 프로그램을 실행합니다.
  • 기능:
    • 다단계 추론을 위한 상태 저장 Python 도구로 훈련됨.
    • 참조 구현은 상태 비저장 모드를 사용합니다.
    • openai‑harmony에서 기본 도구 설명을 재정의할 수 있습니다.
  • 사용법: system 프롬프트에서 .with_python() 또는 .with_tools()를 통해 추가합니다.
  • 보안 경고: 참조 코드는 허용적인 Docker 컨테이너에서 실행됩니다. 프로덕션에서는 자체 제한을 추가하세요.

3. 패치 적용 도구

  • 목적: 로컬 파일을 생성, 업데이트 또는 삭제합니다.
  • 사용 사례: 자동화된 개발 루프의 일부로 코드 또는 프로젝트 파일을 수정합니다.

TRAE에서 GPT OSS를 사용하는 방법?

사전 요구 사항: API 키 얻기

Novita AI는 131K 컨텍스트$0.1/입력, $0.5/출력 비용으로 GPT-OSS 120B API를 제공합니다. Novita AI는 또한 131K 컨텍스트와 $0.05/입력, $0.2/출력 비용의 GPT-OSS 20B를 제공하여 GPT OSS의 코드 에이전트 잠재력을 극대화하기 위한 강력한 지원을 제공합니다.

Novita AI

1단계: 로그인 및 모델 라이브러리 접근 계정에 로그인하고 모델 라이브러리 버튼을 클릭합니다.

Log In and Access the Model Library

지금 GPT OSS 사용해 보세요!

2단계: 모델 선택 사용 가능한 옵션을 탐색하여 요구에 맞는 모델을 선택합니다.

Step 2: Choose Your Model

3단계: 무료 평가판 시작 선택한 모델의 기능을 탐색하려면 무료 평가판을 시작합니다.

Step 3: Start Your Free Trial

4단계: API 키 얻기 API로 인증하려면 새 API 키를 제공합니다. “설정” 페이지에 들어가면 이미지에 표시된 대로 API 키를 복사할 수 있습니다.

get api key

5단계: API 설치 프로그래밍 언어에 특화된 패키지 관리자를 사용하여 API를 설치합니다.

설치 후 필요한 라이브러리를 개발 환경으로 가져옵니다. API 키로 API를 초기화하여 Novita AI LLM과 상호작용을 시작합니다. 아래는 Python 사용자를 위한 채팅 완성 API 사용 예시입니다.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

TRAE에서 GPT‑OSS 사용하기

1단계: Trae 열기 및 모델 접근 Trae 앱을 실행합니다. 오른쪽 상단의 AI 사이드바 토글을 클릭하여 AI 사이드바를 엽니다. 그런 다음 AI 관리로 이동하여 모델을 선택합니다.

Toggle AI Side Bar

go to AI Management and select Models

2단계: 사용자 정의 모델 추가 및 Novita를 공급자로 선택 후 모델 선택 모델 추가 버튼을 클릭하여 사용자 정의 모델 항목을 생성합니다. 모델 추가 대화 상자에서 드롭다운 메뉴에서 공급자 = Novita를 선택합니다.

모델 드롭다운에서 원하는 모델(DeepSeek-R1-0528, Kimi K2, GLM 4.5, DeepSeek-V3-0324 또는 MiniMax-M1-80k)을 선택합니다. 정확한 모델이 목록에 없으면 Novita 라이브러리에서 메모한 모델 ID를 입력하기만 하면 됩니다. 사용하려는 모델의 올바른 변형을 선택했는지 확인하세요.

Add a Custom Model

Choose Novita as Prov

3단계: API 키 입력 Novita 콘솔에서 Novita AI API 키를 복사하여 Trae의 API 키 필드에 붙여넣습니다.

get api key

Novita AI API 키 받기!

GPT OSS의 제한 사항

기능 GPT-OSS (자체 호스팅 모델) GPT-5 API (관리형 플랫폼)
핵심 제공 원시 모델 (엔진에 해당) 완전 통합 플랫폼 (자동차에 해당)
모델 기능 강력하지만 한 세대 뒤처짐 최신 플래그십 추론
내장 도구 없음. 대규모 DIY 노력이 필요합니다. 완전 관리형: 웹 검색, 파일 검색, 코드 인터프리터.
컨텍스트 창 하드웨어(예: 8k-32k)에 의해 실질적으로 제한됨 대용량(400k), 완전 관리형.
에이전트 프레임워크 오픈소스 라이브러리를 사용한 DIY. 관측 가능성 없음. 내장 관측 가능성이 있는 통합 SDK.
엔터프라이즈 기능 없음. 규정 준수, SSO 또는 관리자 제어 기능이 없습니다. 전체 제품군: SOC 2, HIPAA, RBAC, SSO 등.
지원 커뮤니티 기반 및 셀프 서비스. 전담 계정 팀 및 우선 지원.
유지 관리 전체 사용자 책임. 설정, 확장, 가동 시간. 제로. OpenAI에서 완전히 관리합니다.

TRAE와 GPT‑OSS를 통합하면 두 세계의 장점을 모두 취할 수 있습니다:

  • GPT‑OSS는 "뇌"로, Harmony 포맷을 통해 추론 깊이를 조정하고, 출력을 구조화하며, 사고 과정을 표시하거나 숨깁니다.
  • TRAE는 "몸"으로, 통합 작업 공간, 도구 연결 및 자율 소프트웨어 수명 주기 관리—특히 SOLO 모드에서—를 제공합니다.
  • Novita AI는 GPT‑OSS를 호스팅하여 API를 통해 비싼 하드웨어 없이 사용할 수 있도록 하여 간극을 연결합니다.

이 조합을 통해 개발자는 요구사항을 이해하고 의도한 대로 정확하게 실행하는 맞춤형 "AI 엔지니어"를 구축할 수 있어, 진정한 자율 소프트웨어 전달을 가능하게 합니다.

자주 묻는 질문

GPT‑OSS를 폐쇄형 API 모델 대신 TRAE와 함께 사용해야 하는 이유는 무엇인가요?

전체 제어 권한을 얻을 수 있습니다. Harmony 포맷을 통해 TRAE가 추론 깊이, 출력 포맷, 사고 과정 표시 여부를 제어할 수 있습니다. 또한 자체 코드에서 GPT‑OSS를 미세 조정하여 완벽하게 맞출 수 있습니다.

GPT‑OSS를 직접 호스팅해야 하나요?

아니요. Novita AI와 같은 서비스가 호스팅해 주고 API 키를 제공하므로, 비싼 GPU나 복잡한 설정이 필요하지 않습니다.

Harmony 포맷이란 무엇이며 왜 중요한가요?

GPT‑OSS가 이해하는 특별한 메시지 포맷입니다. 출력을 안정적이고 구조화되게 만들어 TRAE가 쉽게 처리할 수 있게 하며, 취약한 파싱이 필요하지 않습니다.

Novita AI는 AI 야망을 실현하는 올인원 클라우드 플랫폼입니다. 통합 API, 서버리스, GPU 인스턴스 — 필요한 비용 효율적인 도구. 인프라를 제거하고 무료로 시작하여 AI 비전을 현실로 만드세요.

추천 읽기

Qwen 3 in RAG Pipelines: All-in-One LLM, Embedding, and Reranking Models

Trae or Claude Code: Which Is More Suitable to Use with Kimi K2?

DeepSeek R1 0528 Cost: API, GPU, On-Prem Comparison