TRAE에서 GPT‑OSS 사용하기: AI 코딩을 위한 Harmony 포맷 활용

TRAE에서 GPT‑OSS 사용하기: AI 코딩을 위한 Harmony 포맷 활용

AI 기반 소프트웨어 개발은 강력한 오픈소스 모델과 완전히 통합된 AI 개발 환경이라는 두 가지 큰 트렌드에 힘입어 빠르게 발전하고 있습니다. GPT‑OSS 는 강력한 추론, 에이전트와 같은 능력, 그리고 심층적인 사용자 정의로 잘 알려진 OpenAI의 오픈 웨이트 모델 시리즈입니다. ByteDance의 TRAE 는 자체적으로 소프트웨어를 구축할 수 있는 완전한 “AI 엔지니어” 역할을 하도록 설계된 AI IDE입니다.

문제는 GPT‑OSS의 제어 가능한 추론 능력과 TRAE의 풍부한 도구 및 자동화된 개발 프레임워크를 결합하면 어떤 일이 일어나는가입니다. 이 둘을 함께 사용하면 자동화되면서도 정확히 사용자의 요구에 맞게 조정된 워크플로우를 만들 수 있습니다. 이 가이드에서는 이들을 연결하고 잠재력을 최대한 발휘하는 방법을 설명합니다.

Trae란 무엇인가요?

TRAE 는 ByteDance가 만든 AI 기반 통합 개발 환경(IDE)의 이름이기도 합니다. 복잡한 작업을 이해하고 실행하여 독립적으로 소프트웨어 솔루션을 구축할 수 있는 “AI 엔지니어” 역할을 하도록 설계되었습니다. TRAE는 사용자가 작업을 AI에 위임할 수 있도록 하여 개발 워크플로우를 간소화하는 것을 목표로 합니다.

trae

Trae의 주요 기능

향상된 도구 통합 및 기능 (모델 컨텍스트 프로토콜 - MCP)

  • 외부 도구 통합: TRAE는 다양한 외부 도구와 통합되어 AI 에이전트가 작업을 더 효과적으로 실행하는 데 사용할 수 있습니다.
  • MCP 지원: AI 애플리케이션을 외부 데이터 소스 및 도구와 연결하기 위한 개방형 표준인 모델 컨텍스트 프로토콜(MCP)을 지원합니다. 이는 AI를 위한 범용 “USB-C” 포트처럼 작동하여 AI 모델을 고립된 데이터에 연결하는 문제를 해결합니다.
  • 확장된 AI 기능: MCP를 통해 에이전트는 Google Drive, Slack, GitHub, 데이터베이스 등의 외부 리소스에 액세스하여 복잡한 작업을 더 잘 이해하고 완료할 수 있습니다.

더 깊은 컨텍스트 이해 및 정밀한 제어

  • 개발 컨텍스트에 대한 깊은 이해: TRAE는 코드 리포지토리, 온라인 검색 결과, 공유 문서 등 개발 컨텍스트를 깊이 이해합니다.
  • 정밀한 동작 사용자 정의: 규칙을 사용자 정의하여 AI의 동작을 워크플로우에 맞게 조정하여 의도한 대로 정확하게 작업을 실행하도록 할 수 있습니다.
  • 다중 모드 상호 작용: 이미지 업로드(예: 디자인 목업, 오류 스크린샷)를 지원하여 요구 사항을 설명하는 데 도움을 주며, AI가 더 정확한 코드를 생성할 수 있게 합니다.

CUE: 스마트 예측 및 원키 편집

  • 다음 편집 예측: CUE(컨텍스트 이해 엔진) 기능은 편집 행동을 분석하여 의도를 이해하고 다음 동작을 예측합니다.
  • 원키 탐색 및 적용: Tab 키를 눌러 다음 제안된 변경 사항으로 이동하거나 여러 줄에 걸쳐 스마트 제안을 한 번에 적용할 수 있습니다.
  • 지속적인 최적화: 이 기능은 성능과 응답성을 지속적으로 개선하여 코드 수정, 생성, 버그 수정에 더 원활한 경험을 제공합니다.

포괄적인 IDE 기능 및 AI 지원

  • 이중 개발 모드: 기존 사용자 제어 워크플로우를 위한 IDE 모드와 완전한 자동화를 위해 요구 사항에서 전달까지 AI가 주도하는 SOLO 모드를 제공합니다.
  • 완전한 기능의 IDE: 코드 편집, 프로젝트 관리, 버전 관리와 같은 표준 IDE 기능을 제공합니다.
  • AI 프로그래밍 지원: 스마트 코드 완성, 리팩토링, 채팅 기반 Q&A, 자연어로부터의 프로젝트 생성을 포함한 다양한 AI 기반 지원 기능을 특징으로 합니다.
  • 내장 웹 미리보기: IDE 내에서 웹 페이지를 직접 미리 볼 수 있어 프론트엔드 개발 및 디버깅이 더 용이합니다.

Trae Solo란 무엇인가요?

Trae Solo란 무엇인가요?

  • 통합 작업 공간 및 AI 도구 허브:
    SOLO 모드는 IDE, 브라우저, 터미널, 문서 등 필요한 모든 개발 도구를 AI에 직접 통합합니다. 이를 통해 AI는 각 작업의 특정 요구 사항에 따라 정확하게 추론하고 행동할 수 있으며, 아이디어에서 실행까지의 격차를 매끄럽게 연결합니다.
  • AI 주도, 종단 간 개발:
    사용자는 요구 사항만 제공하면 SOLO가 다음을 포함한 전체 개발 수명 주기를 자율적으로 처리합니다:
    • 요구 사항 분석
    • 프로토타이핑
    • 프론트엔드 개발
    • 백엔드 개발
    • 디버깅 및 최적화
    • 빌드 및 배포
  • 통합 모니터링 뷰:
    사용자는 단일 통합 뷰에서 AI와 채팅하고 모든 개발 활동을 모니터링할 수 있습니다. "확장 보기"는 모든 실시간 실행 세부 정보를 자세히 볼 수 있게 해줍니다.
  • 다중 모드 상호 작용: “말로” 요구 사항 전달:
    SOLO 모드는 음성 입력을 지원하여 인간 동료와 대화하는 것처럼 자연스럽게 TRAE와 상호 작용할 수 있습니다. AI의 출력은 코드에 국한되지 않으며, 오른쪽의 확장 가능한 동적 뷰는 시각적이고 직관적인 피드백을 제공합니다.
  • 컨텍스트 엔지니어:
    SOLO 모드는 궁극의 "컨텍스트 엔지니어"로 설계되어 작업의 전체 범위를 이해함으로써 가장 포괄적이고 정확한 정보를 기반으로 행동하고 출력할 수 있도록 합니다.

요약하자면, TRAE SOLO 모드의 목표는 "완전한 소프트웨어를 출시하는 AI"를 가능하게 하는 것입니다. 간단한 “Talk. Think. Ship.” 프로세스를 통해 개발자가 실제 소프트웨어를 더 빠르게 구축하고 출시할 수 있도록 지원합니다.

GPT OSS란 무엇인가요?

GPT-OSS(오픈 소스 시리즈)는 OpenAI가 출시한 강력한 오픈 웨이트 언어 모델 제품군으로, 상업적으로 자유롭게 사용할 수 있고 로컬 소비자 하드웨어에서 실행할 수 있도록 설계되었습니다. 이 시리즈에는 200억 및 1200억 매개변수 버전의 두 가지 주요 모델이 포함되어 있으며, 강력한 추론, 도구 사용 및 효율성에 최적화되어 있어 AI 커뮤니티에서 더 큰 투명성을 향한 OpenAI의 중요한 변화를 나타냅니다. 이 모델을 통해 개발자와 연구원은 데이터와 인프라를 완전히 제어하면서 사용자 정의 목적에 맞게 미세 조정할 수 있으며, 폐쇄형 독점 시스템과 오픈 소스 AI 사이의 격차를 해소합니다.

**모델 ** ** 레이어 ** ** 총 매개변수 ** ** 토큰당 활성 매개변수 ** ** 총 전문가 수 ** ** 토큰당 활성 전문가 수 ** ** 컨텍스트 길이 ** ** 단일 GPU VRAM 요구 사항**
gpt-oss-120b 36 117B 5.1B 128 4 128k 80GB
gpt-oss-20b 24 21B 3.6B 32 4 128k 16GB

gpt oss 벤치마크

AI 코드에 GPT OSS를 선택해야 하는 이유는 무엇인가요?

포맷 사용자 정의: Harmony

GPT‑OSS 모델은 Harmony 라는 특별한 대화 형식을 사용합니다. 이 형식은 메시지를 system, user, assistant 와 같은 명확한 역할로 구성하고, 모델이 생각하고 응답하는 방식을 제어할 수 있게 해줍니다. Harmony를 사용하면 추론 깊이(낮음, 중간, 높음)를 조정하고, 사고 과정을 표시하거나 숨길지 결정하며, 모델이 안정적이고 구조화된 방식으로 함수를 호출하도록 할 수 있습니다. 다른 많은 오픈 소스 모델에는 이러한 제어 기능이 내장되어 있지 않지만, GPT‑OSS는 Harmony 지침을 따르도록 훈련되었기 때문에 기본적으로 이를 이해합니다. 따라서 일관되고 신뢰할 수 있으며 도구 친화적인 출력을 얻기가 더 쉽습니다.

Harmony가 제어할 수 있는 것

Harmony 형식을 사용하면 GPT‑OSS 모델의 몇 가지 주요 동작 매개변수를 조정할 수 있습니다:

매개변수 설명 예시
추론 깊이 모델이 수행하는 단계별 사고의 양을 제어합니다. "Reasoning: low", "Reasoning: medium", "Reasoning: high"
함수 호출 OpenAI 스타일의 function_call / tool_calls JSON 출력을 기본 지원합니다. "Always call function weather_api when asked about weather"
추론 가시성 thinking 태그 내의 전체 사고 체인을 표시하거나 숨깁니다. "Show reasoning" / "Hide reasoning"
출력 형식 규칙 JSON, Markdown 등 구조화된 출력을 강제합니다. "Output in JSON format"

Harmony 요청 예시

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Explain how quicksort works."
    }
  ]
}

Trae와 같은 도구와 함께 Harmony를 사용할 때의 이점

코드 생성, 디버깅, 실행 플랫폼(예: Trae )과 통합할 때 Harmony 형식은 여러 실용적인 이점을 제공합니다.

  1. 안정적인 구조화된 출력

    • Harmony는 모델의 출력이 예측 가능한 JSON 또는 코드 블록 형식을 따르도록 보장합니다.
    • Trae는 취약한 정규식이나 후처리 없이 이를 직접 파싱할 수 있습니다.
  2. 추론 깊이 제어

    • 빠른 프로토타이핑이나 간단한 코드에는 낮은 추론을 사용합니다.
    • 정확성이 가장 중요한 복잡한 알고리즘에는 높은 추론을 사용합니다.
    • 추론 비용을 작업 복잡성에 맞춰 GPU/CPU 리소스를 절약합니다.
  3. 추론 가시성 전환

    • 디버깅 및 학습을 위해 thinking 추론을 표시합니다.
    • 프로덕션에서는 추론을 숨겨 토큰을 줄이고 내부 로직이 노출되는 것을 방지합니다.
  4. 명확한 다중 턴 컨텍스트 관리

    • system 규칙이 턴을 넘어 지속되어 일관된 코드 스타일과 실행 규칙을 보장합니다.
    • 전역 설정을 잃지 않고 사용자 지침을 수정하여 쉽게 반복할 수 있습니다.
  5. 원활한 API 통합

    • Harmony는 OpenAI Responses API를 모방하므로 OpenAI와 호환되는 모든 툴체인 또는 IDE 플러그인이 최소한의 변경으로 GPT‑OSS와 함께 작동할 수 있습니다.

GPT OSS 도구 사용

GPT‑OSS 모델은 추론 프로세스의 일부로 외부 도구를 기본적으로 사용하도록 훈련되었으며, **브라우징 **, **Python 실행 **, ** 파일 패치 **에 대한 내장 지원을 제공합니다. 이러한 도구는 Harmony 형식 프롬프트의 system 메시지에 정의하여 활성화됩니다.

1. 브라우저 도구

  • 목적: 웹 검색, 페이지 열기, 페이지 내 텍스트 찾기.

  • 메서드:

    • search — 키워드 검색.
    • open — 특정 페이지 열기.
    • find — 페이지 내 콘텐츠 찾기.
  • 기능:

    • 컨텍스트 크기를 관리하기 위한 스크롤 가능한 텍스트 창.
    • 동일한 페이지를 더 빠르게 다시 방문할 수 있도록 캐싱.
    • 답변에 출처를 인용하도록 훈련됨.
  • 사용법: system 프롬프트에 .with_browser() 또는 .with_tools() 를 사용하여 브라우저 도구 정의를 추가합니다.

  • 참고: 참조 구현은 교육용으로만 제공됩니다. 프로덕션에서는 자체 백엔드를 사용하세요.

2. Python 도구

  • 목적: 사고 체인의 일부로 계산을 수행하거나 작은 프로그램을 실행합니다.

  • 기능:

    • 다단계 추론을 위해 상태 저장 Python 도구로 훈련됨.
    • 참조 구현은 상태 비저장 모드를 사용합니다.
    • openai‑harmony 에서 기본 도구 설명을 재정의할 수 있습니다.
  • 사용법: system 프롬프트에 .with_python() 또는 .with_tools() 를 사용하여 추가합니다.

  • 보안 경고: 참조 코드는 허용적인 Docker 컨테이너에서 실행됩니다. 프로덕션에서는 자체 제한 사항을 추가하세요.

3. 패치 적용 도구

  • 목적: 로컬 파일 생성, 업데이트 또는 삭제.
  • 사용 사례: 자동화된 개발 루프의 일부로 코드 또는 프로젝트 파일을 수정합니다.

Trae에서 GPT OSS를 사용하는 방법은 무엇인가요?

사전 요구 사항: API 키 얻기

Novita AI는 **131K 컨텍스트 ** 의 GPT-OSS 120B API를 제공하며, 비용은 **$0.1/입력 ** 및 **$0.5/출력 ** 입니다. Novita AI는 또한 131 컨텍스트의 GPT-OSS 20B를 비용 **$0.05/입력 ** 및 $0.2/출력 으로 제공하여 GPT OSS의 코드 에이전트 잠재력을 최대한 활용할 수 있도록 강력히 지원합니다.

Novita AI

1단계: 로그인 및 모델 라이브러리 액세스

계정에 로그인하고 Model Library 버튼을 클릭합니다.

로그인 및 모델 라이브러리 액세스

지금 GPT OSS 사용해보기!

2단계: 모델 선택

사용 가능한 옵션을 탐색하고 필요에 맞는 모델을 선택합니다.

2단계: 모델 선택

3단계: 무료 평가판 시작

선택한 모델의 기능을 탐색하려면 무료 평가판을 시작하세요.

3단계: 무료 평가판 시작

4단계: API 키 얻기

API에 인증하려면 새 API 키를 제공합니다. “Settings” 페이지로 이동하여 이미지에 표시된 대로 API 키를 복사할 수 있습니다.

API 키 얻기

5단계: API 설치

프로그래밍 언어에 맞는 패키지 관리자를 사용하여 API를 설치합니다.

설치 후 필요한 라이브러리를 개발 환경으로 가져옵니다. API 키로 API를 초기화하여 Novita AI LLM과 상호 작용을 시작합니다. Python 사용자를 위한 채팅 완료 API 사용 예시입니다.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

TRAE에서 GPT‑OSS 사용하기

1단계: Trae 열기 및 모델 액세스

Trae 앱을 실행합니다. 오른쪽 상단의 Toggle AI Side Bar 를 클릭하여 AI Side Bar 를 엽니다. 그런 다음 AI Management 로 이동하여 Models 를 선택합니다.

AI 사이드바 전환

AI Management로 이동하여 Models 선택

2단계: 사용자 정의 모델 추가 및 제공업체로 Novita 선택 후 모델 선택

Add Model 버튼을 클릭하여 사용자 정의 모델 항목을 만듭니다. 모델 추가 대화 상자에서 드롭다운 메뉴에서 Provider = Novita 를 선택합니다.

Model 드롭다운에서 원하는 모델(DeepSeek-R1-0528, Kimi K2, GLM 4.5, DeepSeek-V3-0324 또는 MiniMax-M1-80k)을 선택합니다. 정확한 모델이 목록에 없으면 Novita 라이브러리에서 기록한 모델 ID를 입력하면 됩니다. 사용하려는 모델의 올바른 변형을 선택했는지 확인하세요.

사용자 정의 모델 추가

제공업체로 Novita 선택

3단계: API 키 입력

Novita 콘솔에서 Novita AI API 키를 복사하여 Trae의 API Key 필드에 붙여넣습니다.

API 키 얻기

Novita AI API 키 받기!

GPT OSS의 한계

기능 GPT-OSS (자체 호스팅 모델) GPT-5 API (관리형 플랫폼)
핵심 제공 사항 원시 모델 (“엔진”) 완전한 통합 플랫폼 (“자동차”)
모델 성능 강력하지만 한 세대 뒤처짐 최첨단, 플래그십 추론
**내장 도구 ** ** 없음.** 상당한 DIY 노력 필요. ** 완전 관리형:** 웹 검색, 파일 검색, 코드 인터프리터.
**컨텍스트 창 ** 하드웨어에 의해 실질적으로 제한됨 (예: 8k-32k) ** 대규모 (400k)**, 완전 관리형.
에이전트 프레임워크 오픈 소스 라이브러리로 DIY. 관찰 가능성 없음. 관찰 가능성이 내장된 통합 SDK.
**엔터프라이즈 기능 ** ** 없음.** 규정 준수, SSO 또는 관리자 제어 없음. ** 전체 제품군:** SOC 2, HIPAA, RBAC, SSO 등.
지원 커뮤니티 기반 및 셀프 서비스. 전담 계정 팀 및 우선 지원.
**유지 관리 ** ** 전적으로 사용자 책임.** 설정, 확장, 가동 시간. ** 없음.** 전적으로 OpenAI에서 처리.

GPT‑OSS와 TRAE를 통합하면 두 세계의 장점을 얻을 수 있습니다:

  • GPT‑OSS 는 "두뇌"이며, Harmony 형식 을 통해 추론 깊이를 조정하고, 출력을 구조화하며, 사고 과정을 숨기거나 표시하도록 제어합니다.
  • TRAE 는 "몸체"로, 통합 작업 공간, 도구 연결, 특히 SOLO 모드에서의 자율 소프트웨어 수명 주기 관리를 제공합니다.
  • Novita AI 는 격차를 해소하여 GPT‑OSS를 호스팅하므로 값비싼 하드웨어 없이 API를 통해 사용할 수 있습니다.

이 조합을 통해 개발자는 요구 사항을 이해하고 의도한 대로 정확하게 실행하는 맞춤형 "AI 엔지니어"를 구축할 수 있으며, 진정한 자율 소프트웨어 제공을 가능하게 합니다.

자주 묻는 질문

왜 폐쇄형 소스 API 모델 대신 TRAE와 함께 GPT‑OSS를 사용해야 하나요?

완전한 제어권을 얻을 수 있습니다. Harmony 형식을 통해 TRAE는 추론 깊이, 출력 형식, 사고 과정 표시 여부를 제어할 수 있습니다. 또한 자체 코드에 GPT‑OSS를 미세 조정하여 완벽하게 맞출 수 있습니다.

GPT‑OSS를 직접 호스팅해야 하나요?

아니요. Novita AI 와 같은 서비스가 이를 호스팅하고 API 키를 제공하므로 값비싼 GPU나 복잡한 설정이 필요하지 않습니다.

Harmony 형식이란 무엇이며 왜 중요한가요?

GPT‑OSS가 이해하는 특별한 메시지 형식입니다. 출력을 안정적이고 구조화되게 만들어 TRAE가 쉽게 처리할 수 있도록 합니다. 취약한 파싱이 필요하지 않습니다.

Novita AI 는 AI 야망을 실현하는 올인원 클라우드 플랫폼입니다. 통합 API, 서버리스, GPU 인스턴스 — 필요한 비용 효율적인 도구. 인프라를 없애고 무료로 시작하여 AI 비전을 현실로 만드세요.

추천 읽을거리

Qwen 3 in RAG Pipelines: All-in-One LLM, Embedding, and Reranking Models

Trae or Claude Code: Which Is More Suitable to Use with Kimi K2?

DeepSeek R1 0528 Cost: API, GPU, On-Prem Comparison