AI 기반 소프트웨어 개발은 강력한 오픈소스 모델과 완전히 통합된 AI 개발 환경이라는 두 가지 큰 트렌드에 힘입어 빠르게 발전하고 있습니다. GPT‑OSS 는 강력한 추론, 에이전트와 같은 능력, 그리고 심층적인 사용자 정의로 잘 알려진 OpenAI의 오픈 웨이트 모델 시리즈입니다. ByteDance의 TRAE 는 자체적으로 소프트웨어를 구축할 수 있는 완전한 “AI 엔지니어” 역할을 하도록 설계된 AI IDE입니다.
문제는 GPT‑OSS의 제어 가능한 추론 능력과 TRAE의 풍부한 도구 및 자동화된 개발 프레임워크를 결합하면 어떤 일이 일어나는가입니다. 이 둘을 함께 사용하면 자동화되면서도 정확히 사용자의 요구에 맞게 조정된 워크플로우를 만들 수 있습니다. 이 가이드에서는 이들을 연결하고 잠재력을 최대한 발휘하는 방법을 설명합니다.
Trae란 무엇인가요?
TRAE 는 ByteDance가 만든 AI 기반 통합 개발 환경(IDE)의 이름이기도 합니다. 복잡한 작업을 이해하고 실행하여 독립적으로 소프트웨어 솔루션을 구축할 수 있는 “AI 엔지니어” 역할을 하도록 설계되었습니다. TRAE는 사용자가 작업을 AI에 위임할 수 있도록 하여 개발 워크플로우를 간소화하는 것을 목표로 합니다.

Trae의 주요 기능
향상된 도구 통합 및 기능 (모델 컨텍스트 프로토콜 - MCP)
- 외부 도구 통합: TRAE는 다양한 외부 도구와 통합되어 AI 에이전트가 작업을 더 효과적으로 실행하는 데 사용할 수 있습니다.
- MCP 지원: AI 애플리케이션을 외부 데이터 소스 및 도구와 연결하기 위한 개방형 표준인 모델 컨텍스트 프로토콜(MCP)을 지원합니다. 이는 AI를 위한 범용 “USB-C” 포트처럼 작동하여 AI 모델을 고립된 데이터에 연결하는 문제를 해결합니다.
- 확장된 AI 기능: MCP를 통해 에이전트는 Google Drive, Slack, GitHub, 데이터베이스 등의 외부 리소스에 액세스하여 복잡한 작업을 더 잘 이해하고 완료할 수 있습니다.
더 깊은 컨텍스트 이해 및 정밀한 제어
- 개발 컨텍스트에 대한 깊은 이해: TRAE는 코드 리포지토리, 온라인 검색 결과, 공유 문서 등 개발 컨텍스트를 깊이 이해합니다.
- 정밀한 동작 사용자 정의: 규칙을 사용자 정의하여 AI의 동작을 워크플로우에 맞게 조정하여 의도한 대로 정확하게 작업을 실행하도록 할 수 있습니다.
- 다중 모드 상호 작용: 이미지 업로드(예: 디자인 목업, 오류 스크린샷)를 지원하여 요구 사항을 설명하는 데 도움을 주며, AI가 더 정확한 코드를 생성할 수 있게 합니다.
CUE: 스마트 예측 및 원키 편집
- 다음 편집 예측: CUE(컨텍스트 이해 엔진) 기능은 편집 행동을 분석하여 의도를 이해하고 다음 동작을 예측합니다.
- 원키 탐색 및 적용:
Tab키를 눌러 다음 제안된 변경 사항으로 이동하거나 여러 줄에 걸쳐 스마트 제안을 한 번에 적용할 수 있습니다. - 지속적인 최적화: 이 기능은 성능과 응답성을 지속적으로 개선하여 코드 수정, 생성, 버그 수정에 더 원활한 경험을 제공합니다.
포괄적인 IDE 기능 및 AI 지원
- 이중 개발 모드: 기존 사용자 제어 워크플로우를 위한 IDE 모드와 완전한 자동화를 위해 요구 사항에서 전달까지 AI가 주도하는 SOLO 모드를 제공합니다.
- 완전한 기능의 IDE: 코드 편집, 프로젝트 관리, 버전 관리와 같은 표준 IDE 기능을 제공합니다.
- AI 프로그래밍 지원: 스마트 코드 완성, 리팩토링, 채팅 기반 Q&A, 자연어로부터의 프로젝트 생성을 포함한 다양한 AI 기반 지원 기능을 특징으로 합니다.
- 내장 웹 미리보기: IDE 내에서 웹 페이지를 직접 미리 볼 수 있어 프론트엔드 개발 및 디버깅이 더 용이합니다.
Trae Solo란 무엇인가요?

- 통합 작업 공간 및 AI 도구 허브:
SOLO 모드는 IDE, 브라우저, 터미널, 문서 등 필요한 모든 개발 도구를 AI에 직접 통합합니다. 이를 통해 AI는 각 작업의 특정 요구 사항에 따라 정확하게 추론하고 행동할 수 있으며, 아이디어에서 실행까지의 격차를 매끄럽게 연결합니다. - AI 주도, 종단 간 개발:
사용자는 요구 사항만 제공하면 SOLO가 다음을 포함한 전체 개발 수명 주기를 자율적으로 처리합니다:- 요구 사항 분석
- 프로토타이핑
- 프론트엔드 개발
- 백엔드 개발
- 디버깅 및 최적화
- 빌드 및 배포
- 통합 모니터링 뷰:
사용자는 단일 통합 뷰에서 AI와 채팅하고 모든 개발 활동을 모니터링할 수 있습니다. "확장 보기"는 모든 실시간 실행 세부 정보를 자세히 볼 수 있게 해줍니다. - 다중 모드 상호 작용: “말로” 요구 사항 전달:
SOLO 모드는 음성 입력을 지원하여 인간 동료와 대화하는 것처럼 자연스럽게 TRAE와 상호 작용할 수 있습니다. AI의 출력은 코드에 국한되지 않으며, 오른쪽의 확장 가능한 동적 뷰는 시각적이고 직관적인 피드백을 제공합니다. - 컨텍스트 엔지니어:
SOLO 모드는 궁극의 "컨텍스트 엔지니어"로 설계되어 작업의 전체 범위를 이해함으로써 가장 포괄적이고 정확한 정보를 기반으로 행동하고 출력할 수 있도록 합니다.
요약하자면, TRAE SOLO 모드의 목표는 "완전한 소프트웨어를 출시하는 AI"를 가능하게 하는 것입니다. 간단한 “Talk. Think. Ship.” 프로세스를 통해 개발자가 실제 소프트웨어를 더 빠르게 구축하고 출시할 수 있도록 지원합니다.
GPT OSS란 무엇인가요?
GPT-OSS(오픈 소스 시리즈)는 OpenAI가 출시한 강력한 오픈 웨이트 언어 모델 제품군으로, 상업적으로 자유롭게 사용할 수 있고 로컬 소비자 하드웨어에서 실행할 수 있도록 설계되었습니다. 이 시리즈에는 200억 및 1200억 매개변수 버전의 두 가지 주요 모델이 포함되어 있으며, 강력한 추론, 도구 사용 및 효율성에 최적화되어 있어 AI 커뮤니티에서 더 큰 투명성을 향한 OpenAI의 중요한 변화를 나타냅니다. 이 모델을 통해 개발자와 연구원은 데이터와 인프라를 완전히 제어하면서 사용자 정의 목적에 맞게 미세 조정할 수 있으며, 폐쇄형 독점 시스템과 오픈 소스 AI 사이의 격차를 해소합니다.
| **모델 ** | ** 레이어 ** | ** 총 매개변수 ** | ** 토큰당 활성 매개변수 ** | ** 총 전문가 수 ** | ** 토큰당 활성 전문가 수 ** | ** 컨텍스트 길이 ** | ** 단일 GPU VRAM 요구 사항** |
| gpt-oss-120b | 36 | 117B | 5.1B | 128 | 4 | 128k | 80GB |
| gpt-oss-20b | 24 | 21B | 3.6B | 32 | 4 | 128k | 16GB |

AI 코드에 GPT OSS를 선택해야 하는 이유는 무엇인가요?
포맷 사용자 정의: Harmony
GPT‑OSS 모델은 Harmony 라는 특별한 대화 형식을 사용합니다. 이 형식은 메시지를 system, user, assistant 와 같은 명확한 역할로 구성하고, 모델이 생각하고 응답하는 방식을 제어할 수 있게 해줍니다. Harmony를 사용하면 추론 깊이(낮음, 중간, 높음)를 조정하고, 사고 과정을 표시하거나 숨길지 결정하며, 모델이 안정적이고 구조화된 방식으로 함수를 호출하도록 할 수 있습니다. 다른 많은 오픈 소스 모델에는 이러한 제어 기능이 내장되어 있지 않지만, GPT‑OSS는 Harmony 지침을 따르도록 훈련되었기 때문에 기본적으로 이를 이해합니다. 따라서 일관되고 신뢰할 수 있으며 도구 친화적인 출력을 얻기가 더 쉽습니다.
Harmony가 제어할 수 있는 것
Harmony 형식을 사용하면 GPT‑OSS 모델의 몇 가지 주요 동작 매개변수를 조정할 수 있습니다:
| 매개변수 | 설명 | 예시 |
|---|---|---|
| 추론 깊이 | 모델이 수행하는 단계별 사고의 양을 제어합니다. | "Reasoning: low", "Reasoning: medium", "Reasoning: high" |
| 함수 호출 | OpenAI 스타일의 function_call / tool_calls JSON 출력을 기본 지원합니다. |
"Always call function weather_api when asked about weather" |
| 추론 가시성 | thinking 태그 내의 전체 사고 체인을 표시하거나 숨깁니다. |
"Show reasoning" / "Hide reasoning" |
| 출력 형식 규칙 | JSON, Markdown 등 구조화된 출력을 강제합니다. | "Output in JSON format" |
Harmony 요청 예시
{
"messages": [
{
"role": "system",
"content": "Reasoning: medium; Hide reasoning; Output in JSON format"
},
{
"role": "user",
"content": "Explain how quicksort works."
}
]
}
Trae와 같은 도구와 함께 Harmony를 사용할 때의 이점
코드 생성, 디버깅, 실행 플랫폼(예: Trae )과 통합할 때 Harmony 형식은 여러 실용적인 이점을 제공합니다.
-
안정적인 구조화된 출력
- Harmony는 모델의 출력이 예측 가능한 JSON 또는 코드 블록 형식을 따르도록 보장합니다.
- Trae는 취약한 정규식이나 후처리 없이 이를 직접 파싱할 수 있습니다.
-
추론 깊이 제어
- 빠른 프로토타이핑이나 간단한 코드에는 낮은 추론을 사용합니다.
- 정확성이 가장 중요한 복잡한 알고리즘에는 높은 추론을 사용합니다.
- 추론 비용을 작업 복잡성에 맞춰 GPU/CPU 리소스를 절약합니다.
-
추론 가시성 전환
- 디버깅 및 학습을 위해
thinking추론을 표시합니다. - 프로덕션에서는 추론을 숨겨 토큰을 줄이고 내부 로직이 노출되는 것을 방지합니다.
- 디버깅 및 학습을 위해
-
명확한 다중 턴 컨텍스트 관리
system규칙이 턴을 넘어 지속되어 일관된 코드 스타일과 실행 규칙을 보장합니다.- 전역 설정을 잃지 않고 사용자 지침을 수정하여 쉽게 반복할 수 있습니다.
-
원활한 API 통합
- Harmony는 OpenAI Responses API를 모방하므로 OpenAI와 호환되는 모든 툴체인 또는 IDE 플러그인이 최소한의 변경으로 GPT‑OSS와 함께 작동할 수 있습니다.
GPT OSS 도구 사용
GPT‑OSS 모델은 추론 프로세스의 일부로 외부 도구를 기본적으로 사용하도록 훈련되었으며, **브라우징 **, **Python 실행 **, ** 파일 패치 **에 대한 내장 지원을 제공합니다. 이러한 도구는 Harmony 형식 프롬프트의 system 메시지에 정의하여 활성화됩니다.
1. 브라우저 도구
-
목적: 웹 검색, 페이지 열기, 페이지 내 텍스트 찾기.
-
메서드:
search— 키워드 검색.open— 특정 페이지 열기.find— 페이지 내 콘텐츠 찾기.
-
기능:
- 컨텍스트 크기를 관리하기 위한 스크롤 가능한 텍스트 창.
- 동일한 페이지를 더 빠르게 다시 방문할 수 있도록 캐싱.
- 답변에 출처를 인용하도록 훈련됨.
-
사용법:
system프롬프트에.with_browser()또는.with_tools()를 사용하여 브라우저 도구 정의를 추가합니다. -
참고: 참조 구현은 교육용으로만 제공됩니다. 프로덕션에서는 자체 백엔드를 사용하세요.
2. Python 도구
-
목적: 사고 체인의 일부로 계산을 수행하거나 작은 프로그램을 실행합니다.
-
기능:
- 다단계 추론을 위해 상태 저장 Python 도구로 훈련됨.
- 참조 구현은 상태 비저장 모드를 사용합니다.
openai‑harmony에서 기본 도구 설명을 재정의할 수 있습니다.
-
사용법:
system프롬프트에.with_python()또는.with_tools()를 사용하여 추가합니다. -
보안 경고: 참조 코드는 허용적인 Docker 컨테이너에서 실행됩니다. 프로덕션에서는 자체 제한 사항을 추가하세요.
3. 패치 적용 도구
- 목적: 로컬 파일 생성, 업데이트 또는 삭제.
- 사용 사례: 자동화된 개발 루프의 일부로 코드 또는 프로젝트 파일을 수정합니다.
Trae에서 GPT OSS를 사용하는 방법은 무엇인가요?
사전 요구 사항: API 키 얻기
Novita AI는 **131K 컨텍스트 ** 의 GPT-OSS 120B API를 제공하며, 비용은 **$0.1/입력 ** 및 **$0.5/출력 ** 입니다. Novita AI는 또한 131 컨텍스트의 GPT-OSS 20B를 비용 **$0.05/입력 ** 및 $0.2/출력 으로 제공하여 GPT OSS의 코드 에이전트 잠재력을 최대한 활용할 수 있도록 강력히 지원합니다.
Novita AI
1단계: 로그인 및 모델 라이브러리 액세스
계정에 로그인하고 Model Library 버튼을 클릭합니다.

2단계: 모델 선택
사용 가능한 옵션을 탐색하고 필요에 맞는 모델을 선택합니다.

3단계: 무료 평가판 시작
선택한 모델의 기능을 탐색하려면 무료 평가판을 시작하세요.

4단계: API 키 얻기
API에 인증하려면 새 API 키를 제공합니다. “Settings” 페이지로 이동하여 이미지에 표시된 대로 API 키를 복사할 수 있습니다.

5단계: API 설치
프로그래밍 언어에 맞는 패키지 관리자를 사용하여 API를 설치합니다.
설치 후 필요한 라이브러리를 개발 환경으로 가져옵니다. API 키로 API를 초기화하여 Novita AI LLM과 상호 작용을 시작합니다. Python 사용자를 위한 채팅 완료 API 사용 예시입니다.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
TRAE에서 GPT‑OSS 사용하기
1단계: Trae 열기 및 모델 액세스
Trae 앱을 실행합니다. 오른쪽 상단의 Toggle AI Side Bar 를 클릭하여 AI Side Bar 를 엽니다. 그런 다음 AI Management 로 이동하여 Models 를 선택합니다.


2단계: 사용자 정의 모델 추가 및 제공업체로 Novita 선택 후 모델 선택
Add Model 버튼을 클릭하여 사용자 정의 모델 항목을 만듭니다. 모델 추가 대화 상자에서 드롭다운 메뉴에서 Provider = Novita 를 선택합니다.
Model 드롭다운에서 원하는 모델(DeepSeek-R1-0528, Kimi K2, GLM 4.5, DeepSeek-V3-0324 또는 MiniMax-M1-80k)을 선택합니다. 정확한 모델이 목록에 없으면 Novita 라이브러리에서 기록한 모델 ID를 입력하면 됩니다. 사용하려는 모델의 올바른 변형을 선택했는지 확인하세요.


3단계: API 키 입력
Novita 콘솔에서 Novita AI API 키를 복사하여 Trae의 API Key 필드에 붙여넣습니다.

GPT OSS의 한계
| 기능 | GPT-OSS (자체 호스팅 모델) | GPT-5 API (관리형 플랫폼) |
|---|---|---|
| 핵심 제공 사항 | 원시 모델 (“엔진”) | 완전한 통합 플랫폼 (“자동차”) |
| 모델 성능 | 강력하지만 한 세대 뒤처짐 | 최첨단, 플래그십 추론 |
| **내장 도구 ** | ** 없음.** 상당한 DIY 노력 필요. | ** 완전 관리형:** 웹 검색, 파일 검색, 코드 인터프리터. |
| **컨텍스트 창 ** | 하드웨어에 의해 실질적으로 제한됨 (예: 8k-32k) | ** 대규모 (400k)**, 완전 관리형. |
| 에이전트 프레임워크 | 오픈 소스 라이브러리로 DIY. 관찰 가능성 없음. | 관찰 가능성이 내장된 통합 SDK. |
| **엔터프라이즈 기능 ** | ** 없음.** 규정 준수, SSO 또는 관리자 제어 없음. | ** 전체 제품군:** SOC 2, HIPAA, RBAC, SSO 등. |
| 지원 | 커뮤니티 기반 및 셀프 서비스. | 전담 계정 팀 및 우선 지원. |
| **유지 관리 ** | ** 전적으로 사용자 책임.** 설정, 확장, 가동 시간. | ** 없음.** 전적으로 OpenAI에서 처리. |
GPT‑OSS와 TRAE를 통합하면 두 세계의 장점을 얻을 수 있습니다:
- GPT‑OSS 는 "두뇌"이며, Harmony 형식 을 통해 추론 깊이를 조정하고, 출력을 구조화하며, 사고 과정을 숨기거나 표시하도록 제어합니다.
- TRAE 는 "몸체"로, 통합 작업 공간, 도구 연결, 특히 SOLO 모드에서의 자율 소프트웨어 수명 주기 관리를 제공합니다.
- Novita AI 는 격차를 해소하여 GPT‑OSS를 호스팅하므로 값비싼 하드웨어 없이 API를 통해 사용할 수 있습니다.
이 조합을 통해 개발자는 요구 사항을 이해하고 의도한 대로 정확하게 실행하는 맞춤형 "AI 엔지니어"를 구축할 수 있으며, 진정한 자율 소프트웨어 제공을 가능하게 합니다.
자주 묻는 질문
왜 폐쇄형 소스 API 모델 대신 TRAE와 함께 GPT‑OSS를 사용해야 하나요?
완전한 제어권을 얻을 수 있습니다. Harmony 형식을 통해 TRAE는 추론 깊이, 출력 형식, 사고 과정 표시 여부를 제어할 수 있습니다. 또한 자체 코드에 GPT‑OSS를 미세 조정하여 완벽하게 맞출 수 있습니다.
GPT‑OSS를 직접 호스팅해야 하나요?
아니요. Novita AI 와 같은 서비스가 이를 호스팅하고 API 키를 제공하므로 값비싼 GPU나 복잡한 설정이 필요하지 않습니다.
Harmony 형식이란 무엇이며 왜 중요한가요?
GPT‑OSS가 이해하는 특별한 메시지 형식입니다. 출력을 안정적이고 구조화되게 만들어 TRAE가 쉽게 처리할 수 있도록 합니다. 취약한 파싱이 필요하지 않습니다.
Novita AI 는 AI 야망을 실현하는 올인원 클라우드 플랫폼입니다. 통합 API, 서버리스, GPU 인스턴스 — 필요한 비용 효율적인 도구. 인프라를 없애고 무료로 시작하여 AI 비전을 현실로 만드세요.
추천 읽을거리
Qwen 3 in RAG Pipelines: All-in-One LLM, Embedding, and Reranking Models
Trae or Claude Code: Which Is More Suitable to Use with Kimi K2?
