OpenClaw는 작업 자동화, 워크플로 관리, 24/7 온라인 유지 등에서 가장 인기 있는 AI 에이전트 프레임워크 중 하나로 빠르게 자리 잡았습니다. 하지만 일단 실행하고 나면 필연적으로 다음 질문이 떠오릅니다: 실제로 어떤 모델을 사용해야 할까?
단 하나의 정답은 없습니다. 가장 현명한 접근 방식은 계층적 전략입니다. 중요한 작업에는 프리미엄 모델을, 일상적인 작업에는 적절한 중간급 모델을, 대량의 일상 작업을 처리할 때는 저렴한 모델을 사용하는 것입니다. 이 가이드에서는 각 계층에 대한 구체적인 모델 추천을 가격, 컨텍스트 창, 각 모델의 강점과 함께 설명합니다.
계층적 모델 전략
모든 작업에 하나의 모델을 고르는 것은 마치 액자를 걸기 위해 큰 망치를 사용하는 것과 같습니다. 복잡한 추론 작업은 최첨단 지능이 필요하지만, 간단한 파일 정리는 그렇지 않습니다. 모든 요청에 프리미엄 모델을 실행하면 예산이 빠르게 소진됩니다.
가장 효과적인 OpenClaw 설정은 세 가지 계층을 사용합니다:
- 1계층 (고성능): 중요한 작업을 위한 강력한 모델 — 복잡한 추론, 코드 리뷰, 고위험 결정
- 2계층 (일상용): 대부분의 실제 작업 처리 — 코드 생성, 콘텐츠 작성, 다단계 에이전트 워크플로
- 3계층 (예산): 간단한 작업을 최소 비용으로 처리 — 파일 정리, 기본 Q&A, 일상 자동화
각 계층에 대해 권장하는 내용은 다음과 같습니다.
OpenClaw에서 프롬프트 캐싱이 중요한 이유
OpenClaw 에이전트는 긴 시스템 프롬프트, 영구 메모리 파일, 방대한 대화 기록을 유지하며, 종종 요청당 수만 개의 토큰을 전송합니다. 캐싱이 없으면 매번 반복되는 토큰에 대해 전체 입력 가격을 지불해야 합니다.
프롬프트 캐싱이 이 문제를 해결합니다. 모델이 지원하는 경우, 제공자는 이전에 본 입력 접두사를 저장하고 이후 요청에 대해 큰 할인을 제공합니다. 항상 켜져 있는 OpenClaw 에이전트의 경우 비용 절감 효과가 상당합니다:
- 시스템 프롬프트 및 스킬 파일 — 매 턴마다 로드되며, 첫 번째 요청 후 자동으로 캐시됨
- 대화 기록 — 새로운 메시지만 전체 입력 비용이 발생하며, 캐시 경계 이전의 모든 것은 할인 적용
- 메모리 및 컨텍스트 파일 — MEMORY.md, RULES.md 및 턴마다 거의 변경되지 않는 기타 작업 공간 파일
Novita AI에서 권장 모델 대부분은 프롬프트 캐싱을 지원하며, 캐시된 토큰에 대해 입력 비용 50–90% 절감 효과를 제공합니다. 각 모델의 캐시 가격은 아래 계층에서 표준 가격과 함께 나열되어 있습니다.
1계층: 고성능 모델 — 반드시 정확해야 할 때
일부 작업은 가장 강력한 추론 능력을 요구합니다. 정확성이 절대적이거나 단 한 번의 실수가 큰 손실로 이어질 때, 이 모델들을 사용해야 합니다.
Claude Sonnet 4.6 및 Claude Opus 4.6
Anthropic의 Claude 모델은 복잡한 추론과 미묘한 지시 따르기 분야에서 최고의 기준으로 널리 인정받고 있습니다. Sonnet은 대부분의 고급 작업에 대해 속도와 지능의 강력한 균형을 제공하며, Opus는 정밀함이 무엇보다 중요한 작업을 위한 최고의 옵션입니다.
GPT-5.4
전문 작업을 위한 OpenAI의 가장 뛰어난 모델입니다. GPT-5.4는 주력 추론 모드로, 270K 토큰 미만의 컨텍스트 길이에 대해 표준 처리를 제공합니다. 복잡한 다단계 추론, 코드 생성, 깊은 분석적 사고가 필요한 작업에 탁월하여, 프리미엄 비용을 정당화할 만한 정밀도가 요구되는 고위험 에이전트 워크플로에 적합합니다.
Gemini 3 Flash Preview
Google의 Gemini 3 Flash는 빠른 응답 시간과 함께 첨단 수준의 기능을 제공하여, 까다로운 작업에서 속도와 깊이를 모두 원할 때 확실한 선택이 됩니다.
💡1계층 사용 시기:
- 복잡한 다중 파일 코드 리팩토링
- 고위험 의사 결정 분석
- 단일 오류가 큰 비용을 초래하는 작업
- 중요한 출력물 검토 및 검증
⚖️절충점: 이 모델들은 뛰어난 품질을 제공하지만 프리미엄 가격이 붙습니다. 매일 수백 개의 요청을 처리하는 항상 켜져 있는 OpenClaw 에이전트의 경우, 모든 작업에 1계층을 실행하면 비용이 빠르게 증가합니다. 그래서 다음 두 계층이 중요합니다 — 에이전트 작업의 대부분을 훨씬 적은 비용으로 처리할 수 있습니다.
2계층: 일상용 모델 — 대부분의 작업, 최고의 가치
이곳에서 에이전트가 대부분의 사고 시간을 보냅니다. 이 모델들은 실제로 중요한 작업에 대해 비용과 성능의 균형을 맞추며, 1계층으로 올릴 필요가 거의 없을 정도로 충분히 우수합니다.
Kimi K2.5
Moonshot AI의 Kimi K2.5는 에이전트 작업 부하에서 두드러진 선택이 되었습니다. MoE (Mixture-of-Experts) 아키텍처를 기반으로 구축되어 도구 사용, 다단계 계획, 코드 생성에 특별히 최적화되었습니다 — 이는 OpenClaw 에이전트가 가장 많이 의존하는 기능들입니다.
K2.5를 차별화하는 것은 에이전트 성능입니다. 코딩 벤치마크에서 최상위 모델 중 하나이며, 툴 호출 정확도는 훨씬 더 비싼 모델과 맞먹습니다. 262K 컨텍스트 창은 여러 문서나 긴 대화 기록을 포함하는 복잡한 워크플로에 충분히 넉넉합니다.
- 컨텍스트 창: 262K 토큰
- 가격: $0.60/M 입력 · $3.00/M 출력 · $0.10/M 캐시 입력
- 강점: 가격 대비 최고 수준의 에이전트 능력, 뛰어난 코드 생성 및 도구 사용, 강력한 다단계 추론.
- 최적 용도: 주력 일상용 모델 — 코드 작성, 다단계 에이전트 워크플로, 연구 작업, 도구 호출이 필요한 모든 작업.
Novita Playground에서 Kimi K2.5 사용해보기
GLM-5
Z.ai의 주력 모델은 GLM-4 시리즈에서 크게 업그레이드되었습니다. GLM-5는 추론 및 코딩 작업에서 최첨단 모델과 경쟁하면서도 경쟁력 있는 가격을 유지합니다. 수학적 추론, 코드 생성, 구조화된 출력에서 향상된 기능을 제공하여, 안정적인 도구 사용이 필요한 에이전트 워크플로에 특히 적합합니다.
- 컨텍스트 창: 202K 토큰
- 가격: $1.00/M 입력 · $3.20/M 출력 · $0.20/M 캐시 입력
- 강점: 강력한 추론, 구조화된 출력 및 함수 호출에 매우 효과적, 가격이 2~3배인 모델과 경쟁하는 벤치마크 성능.
- 최적 용도: 복잡한 에이전트 작업 — 코드 분석, 다단계 문제 해결, 보고서 생성, 도구 사용이 많은 워크플로.
Novita Playground에서 GLM-5 사용해보기
Qwen3.5-397B-A17B
Alibaba의 Qwen 3.5 시리즈 중 가장 큰 모델로, 순방향 패스당 전체 파라미터의 일부만 활성화하는 MoE 아키텍처를 기반으로 합니다. 즉, 대형 모델 수준의 지능을 예상 비용의 일부로 얻을 수 있습니다. 262K 컨텍스트 창으로 확장된 에이전트 세션과 다중 문서 워크플로를 컨텍스트 저하 없이 처리합니다.
- 컨텍스트 창: 262K 토큰
- 가격: $0.60/M 입력 · $3.60/M 출력
- 강점: 최첨단에 가까운 추론 및 코딩 성능, 뛰어난 장문 컨텍스트 처리, 효율적인 MoE 추론.
- 최적 용도: 중간 가격대에서 최대 성능이 필요한 작업 — 복잡한 코드 생성, 분석 추론, 장문 컨텍스트 연구 작업.
Novita Playground에서 Qwen3.5-397B-A17B 사용해보기
💡2계층에 적합한 작업:
- 코드 생성 및 디버깅
- 콘텐츠 제작 및 편집
- 다단계 에이전트 워크플로
- 연구 및 분석 작업
- 도구 사용 및 함수 호출
3계층: 예산 모델 — 간단한 작업, 최소 비용
이 모델들은 대량의 낮은 복잡도 작업을 처리합니다. 간단한 작업에 대해 놀라울 정도로 유능하며 토큰 비용을 통제할 수 있습니다.
DeepSeek V3.2
DeepSeek의 최신 범용 모델로, 코딩, 수학, 일반 추론에서 강력한 성능을 제공하는 MoE 아키텍처를 기반으로 하며 가격은 매우 저렴합니다. 효율적인 설계 덕분에 프리미엄 비용 없이 양질의 출력을 얻을 수 있습니다.
- 컨텍스트 창: 163K 토큰
- 가격: $0.269/M 입력 · $0.40/M 출력 · $0.13/M 캐시 입력
- 강점: 뛰어난 비용 대비 성능 비율, 견고한 코딩 능력, 빠른 추론 속도.
- 최적 용도: 일상적인 에이전트 작업, 데이터 추출, 텍스트 서식 지정, 일반 Q&A.
Novita Playground에서 DeepSeek V3.2 사용해보기
GLM-4.7 Flash
Zhipu AI의 속도 최적화 모델로, 응답 지연 시간이 최고 추론 깊이보다 더 중요한 높은 처리량 시나리오를 위해 설계되었습니다. 중국어와 영어를 모두 잘 지원하므로 다국어 에이전트 설정에 강력한 선택입니다.
- 컨텍스트 창: 200K 토큰
- 가격: $0.07/M 입력 · $0.40/M 출력 · $0.01/M 캐시 입력
- 강점: 200K 컨텍스트 창을 제공하는 가장 저렴한 모델 중 하나. 매우 빠른 응답 시간. 구조화된 출력 및 지시 따르기에 강함.
- 최적 용도: 대량의 낮은 복잡도 작업 — 요약, 분류, 데이터 서식 지정, 알림 워크플로.
Novita Playground에서 GLM-4.7 Flash 사용해보기
MiniMax M2.5
MiniMax의 M2.5는 가격 대비 뛰어난 성능을 발휘하는 유능한 올라운더입니다. 문서 분석과 확장된 대화를 잘 처리하며, 긴 컨텍스트 창을 지원하여 다중 턴 워크플로에서도 성능 저하가 없습니다.
- 컨텍스트 창: 204K 토큰
- 가격: $0.30/M 입력 · $1.20/M 출력 · $0.03/M 캐시 입력
- 강점: 안정적인 장문 컨텍스트 성능, 복잡한 지시를 잘 따름, 강력한 다국어 지원.
- 최적 용도: 가장 저렴한 모델보다 약간 더 많은 성능이 필요한 작업 — 문서 요약, 다중 턴 대화, 콘텐츠 초안 작성.
Novita Playground에서 MiniMax M2.5 사용해보기
💡3계층에 적합한 작업:
- 파일 관리 및 정리
- 간단한 질문 응답
- 데이터 서식 지정 및 추출
- 일상적인 알림 및 요약
Novita AI에서 모델 스택 실행하기
위에서 추천된 모든 2계층 및 3계층 모델(Kimi K2.5, GLM-5, Qwen3.5-397B-A17B, DeepSeek V3.2, GLM-4.7 Flash, MiniMax M2.5)은 단일 API 키를 통해 Novita AI에서 사용할 수 있습니다.
이것이 OpenClaw 사용자에게 중요한 이유:
- OpenAI/Anthropic 호환 API 형식 — 사용자 정의 어댑터 없이 OpenClaw의 모델 설정에 직접 연결
- 하나의 API 키, 여러 모델 — 별도의 계정을 관리하지 않고 계층 간 전환
- 대부분의 모델에서 프롬프트 캐싱 지원 — 장문 컨텍스트 에이전트 세션의 입력 비용을 크게 줄이고 응답 속도 향상
- 토큰당 과금 — 구독이나 최소 약정 없음
이 모델들은 Novita AI Playground에서 대화형으로 사용해볼 수도 있습니다. 프롬프트를 실험하고, 파라미터를 시각적으로 탐색하며, OpenClaw에 배포하기 전에 즉각적인 피드백을 받을 수 있는 웹 기반 환경입니다.
Kimi K2.5와 같은 모델을 OpenClaw 에이전트에 통합하는 방법(Telegram 봇 설정 및 고급 구성 포함)에 대한 단계별 가이드는 상세 튜토리얼을 확인하세요: OpenClaw(Clawdbot)에서 Kimi K2.5 사용하기: Novita로 Telegram 에이전트 빠른 설정.
NovitaClaw: 한 줄 명령으로 OpenClaw 배포하기
인프라를 관리하지 않고 OpenClaw 에이전트를 클라우드에서 24/7 실행하고 싶으신가요? NovitaClaw를 사용하면 한 줄 명령으로 바로 실행할 수 있습니다.
NovitaClaw는 Novita Agent Sandbox를 기반으로 구축된 배포 도구로, 터미널에서 완전히 구성된 OpenClaw 인스턴스를 프로비저닝합니다. 세 단계, 모든 플랫폼:
1단계: NovitaClaw 설치
sudo pip3 install novitaclaw
2단계: API 키 설정
export NOVITA_API_KEY=sk_your_api_key
3단계: 실행
novitaclaw launch
1단계: NovitaClaw 설치
pip install novitaclaw
2단계: API 키 설정
$env:NOVITA_API_KEY = "sk_your_api_key"
3단계: 실행
novitaclaw launch
이것으로 끝입니다. 1분 안에 다음을 얻을 수 있습니다:
- 24/7 OpenClaw 에이전트 — 세션 제한, 수동 재시작 없음. 필요한 만큼 에이전트가 온라인 상태를 유지합니다.
- Novita 모델 사전 구성 — 계층형 모델 스택이 즉시 사용 가능합니다. 웹 UI 설정을 통해 언제든지 모델을 전환할 수 있습니다.
- 다중 채널 지원 — Telegram, Discord 및 기타 메시징 플랫폼에 연결하여 어디서든 에이전트에 접근할 수 있습니다.
- 자동 복구 — 에이전트가 충돌하면 자동으로 다시 시작되고 마지막 작업 구성을 복원합니다. 데이터 손실이나 수동 개입이 필요 없습니다.
- 내장 웹 터미널 및 파일 관리자 — 브라우저에서 직접 에이전트 환경에 접근하여 디버깅 및 파일 관리를 할 수 있습니다.
기본 샌드박스는 2 vCPU와 4 GB RAM에서 실행되며, 데모가 아닌 실제 프로덕션 워크로드에 적합한 크기입니다. Novita 플랫폼의 모든 모델이 지원되며, 1계층 접근이 필요한 경우 Claude나 Gemini와 같은 타사 API 키를 자체적으로 가져올 수도 있습니다.
👉 전체 설정 가이드(모델 구성, Telegram 봇 통합, 고급 옵션 포함)는 NovitaClaw: 한 줄 명령으로 클라우드에서 OpenClaw 실행하기를 참조하세요.
OpenRouter 사용 데이터 참고 사항
더 넓은 커뮤니티에서 무엇을 사용하는지 궁금하신 분들을 위해: OpenClaw는 현재 OpenRouter에서 일일 사용량 기준 1위 앱이며, 2026년 3월 기준 348개 모델에 걸쳐 12.6조 개의 토큰을 처리했습니다.

토큰 볼륨 기준 상위 모델로는 Step 3.5 Flash(2.2T), MiniMax M2.5(1.3T), Kimi K2.5(962B), Claude Sonnet 4.6(805B), GLM 5 Turbo(579B) 등이 있습니다. 상위권에 있는 일부 모델은 프로모션 이벤트나 무료 티어 가용성으로 인해 사용량이 높을 수 있으므로, 원시 토큰 볼륨이 항상 모델 품질을 직접 반영하는 것은 아닙니다. 이 문서에서 권장하는 계층형 전략은 사용 패턴, 모델 성능, 실제 커뮤니티 피드백의 조합을 기반으로 합니다.

출처: OpenRouter
결론
가장 효과적인 OpenClaw 설정은 단일 모델에 의존하지 않습니다. 세 가지 계층을 사용합니다. Claude와 같은 고성능 모델은 최고의 정확성이 요구되는 순간을 처리합니다. Kimi K2.5와 GLM-5 같은 일상용 모델은 합리적인 비용으로 실제 사고를 수행합니다. 그리고 DeepSeek V3.2와 GLM-4.7 Flash 같은 예산 모델은 대량의 일상 작업을 흡수합니다.
Novita AI를 사용하면 모든 2계층 및 3계층 권장 모델을 단일 API로 액세스할 수 있습니다. 그리고 NovitaClaw를 사용하면 전체 스택을 한 줄 명령으로 배포할 수 있습니다. 인프라가 필요하지 않습니다.
Novita AI 는 개발자와 스타트업이 고성능, 안정성, 비용 효율성으로 모델과 에이전트 애플리케이션을 구축, 배포, 확장할 수 있도록 지원하는 AI 및 에이전트 클라우드 플랫폼입니다.
자주 묻는 질문
OpenClaw에 가장 적합한 모델은 무엇인가요?
단일 최고 모델은 없습니다. 사용 사례에 따라 다릅니다. 대부분의 사용자에게는 일반 작업에 Kimi K2.5나 GLM-5 같은 일상용 모델을, 간단한 작업에 DeepSeek V3.2 같은 예산 모델을 사용하는 계층형 접근 방식이 가장 효과적입니다. 이 모든 모델은 Novita AI에서 하나의 API 키로 사용할 수 있습니다.
Novita AI는 OpenClaw와 호환되나요?
네. Novita AI는 OpenAI/Anthropic 호환 API 형식을 제공하므로, 사용자 정의 어댑터 없이 OpenClaw의 모델 설정에 직접 연결할 수 있습니다. 또한 속도 제한이 없고 토큰당 과금 방식을 제공하는데, 이는 항상 켜져 있는 에이전트에게 중요합니다.
Novita AI로 OpenClaw를 어떻게 설정하나요?
두 가지 옵션이 있습니다. 이미 OpenClaw를 실행 중이라면 Novita API 키로 구성하기만 하면 됩니다. API는 OpenAI/Anthropic과 호환되므로 기본 URL과 모델 이름만 업데이트하면 됩니다. 자세한 안내는 단계별 튜토리얼을 참조하세요. 처음부터 시작하려면 NovitaClaw가 완전히 구성된 인스턴스를 한 줄 명령(novitaclaw launch)으로 배포하며, 24/7 가동 시간과 자동 복구를 제공합니다. 자세한 내용은 NovitaClaw 설정 가이드를 참조하세요.
