Chain-of-Thought (CoT) 프롬프팅이 산술 추론부터 상식 및 기호 추론에 이르기까지 다양한 영역에서 대규모 언어 모델(LLM)을 어떻게 향상시키는지 당사 블로그에서 알아보세요.
소개
대규모 언어 모델(LLM)은 자연어 이해 및 생성 분야에서 비교할 수 없는 역량을 제공하며 인공지능의 지형을 변화시켰습니다. 하지만 복잡한 추론 작업을 수행하는 능력은 광범위한 연구의 초점이 되어 왔습니다. 이 분야에서 유망한 접근 방식 중 하나는 Chain-of-Thought (CoT) 프롬프팅입니다. 이 글에서는 CoT 프롬프팅의 미묘한 차이와 LLM의 미래 궤적에 미치는 영향에 대해 자세히 살펴봅니다.
최근 논문에서 설명된 CoT 프롬프팅은 LLM이 추론 과정을 설명하도록 유도하는 전략입니다. 이는 추론 경로가 few-shot 방식으로 명시적으로 설명된 예시 세트를 모델에 제공하는 것을 수반합니다. LLM이 프롬프트에 응답할 때 유사한 추론 궤적을 모방할 것으로 기대합니다. 이 방법론은 복잡한 추론이 필요한 작업에서 모델의 효능을 눈에 띄게 향상시키는 것으로 입증되었습니다.

CoT 프롬프팅의 주요 장점 중 하나는 산술, 상식 및 기호 추론을 수반하는 작업에서 LLM의 성능을 강화하는 능력에 있습니다. 연구에 따르면 약 1000억 개의 매개변수를 가진 모델에서 상당한 성능 향상이 나타났습니다. 반대로, 소규모 모델은 비논리적인 사고 체인을 생성하는 경향을 보여 기존 프롬프팅 기술에 비해 정확도가 저하되었습니다.
Chain-of-Thought 프롬프팅 이해하기
본질적으로 CoT 프롬프팅은 LLM이 단계별로 생각하도록 유도하는 것을 수반합니다. 여기에는 추론 과정을 설명하는 few-shot 예시를 모델에 제시하는 것이 포함됩니다. 그런 다음 모델은 프롬프트에 대한 응답을 공식화할 때 비교 가능한 사고 체인을 따르는 작업을 수행합니다. 이러한 방법은 응답을 생성하기 전에 일련의 추론 단계를 요구하는 복잡한 작업에 특히 효과적입니다.
다음은 few-shot 전략을 활용한 CoT 프롬프트의 예시입니다:

다음은 대규모 언어 모델(novita.ai 제공)이 응답하는 방식입니다:

CoT 프롬프팅은 zero-shot 맥락으로도 확장될 수 있습니다. 이 시나리오에서는 초기 프롬프트에 "단계별로 접근해 봅시다"와 같은 문구를 추가하는 것을 수반하며, 이는 few-shot 프롬프팅을 보완할 수 있습니다. 이러한 사소한 포함은 프롬프트에 활용할 충분한 예시가 없는 작업에서 모델의 효능을 향상시키는 데 효과적인 것으로 입증되었습니다.
수동 CoT의 과제
Manual-CoT의 놀라운 성과에도 불구하고, 수동 데모 생성은 장애물을 제시합니다. 다양한 작업은 고유한 데모를 요구하며, 효과적인 데모를 만드는 데는 상당한 노력이 필요할 수 있습니다. 이러한 과제를 극복하기 위해 연구자들은 Auto-CoT로 알려진 자동화된 CoT 프롬프팅 접근 방식을 옹호합니다. 이 방법은 "단계별로 접근해 봅시다"라는 프롬프트와 함께 LLM을 활용하여 데모를 위한 추론 체인을 자율적으로 생성합니다.
Auto-CoT에서 다양성의 역할
연구에서 얻은 중추적인 발견 중 하나는 자동화된 데모 구성에서 다양성의 중요성을 강조합니다. 연구자들은 자동 생성된 추론 체인에 오류가 자주 포함된다는 점을 관찰했습니다. 이러한 오류의 영향을 완화하기 위해 Auto-CoT라는 자동화된 CoT 프롬프팅 기술을 도입합니다. Auto-CoT는 다양한 속성을 가진 질문을 선택하고 추론 체인을 생성하여 데모를 구성합니다. 다양성을 활용함으로써 Auto-CoT는 자동 구성된 데모의 품질을 향상시키기 위해 노력합니다.
Chain of Thought 프롬프팅의 이점
대규모 언어 모델(LLM)과 함께 Chain of Thought (CoT) 프롬프팅을 활용하면 여러 가지 이점이 제공되며, 보다 효과적이고 효율적인 상호 작용을 촉진합니다. 주요 이점은 다음과 같습니다:
- 향상된 정밀도: CoT 프롬프팅은 일련의 프롬프트를 통해 모델을 안내하여 정확하고 관련성 높은 응답을 얻을 가능성을 눈에 띄게 높입니다. 이러한 구조화된 접근 방식은 모델의 이해를 정제하는 데 도움이 되어 더 정확한 출력을 제공합니다.
- 향상된 제어: 체인은 LLM과 상호 작용하기 위한 구조화된 프레임워크를 제공하여 사용자에게 모델 출력에 대한 더 큰 제어권을 부여합니다. 일련의 프롬프트를 따름으로써 사용자는 대화를 의도된 방향으로 유도하여 의도하지 않거나 관련 없는 결과의 위험을 최소화할 수 있습니다.
- 일관된 맥락 유지: 체인 내 적응형 학습은 대화 전반에 걸쳐 맥락이 일관되게 보존되도록 보장합니다. 이러한 맥락 유지는 모델이 진행 중인 대화에 대한 기억을 유지함에 따라 더 일관되고 의미 있는 상호 작용을 촉진합니다.
- 효율성: CoT 프롬프팅은 여러 입력의 필요성을 없애 시간을 절약하여 상호 작용 프로세스를 간소화합니다. 사용자는 특히 LLM 프롬프트에서 특정 결과를 목표로 할 때 특정 결과를 더 효율적으로 달성할 수 있습니다.
- 향상된 추론 능력: CoT 프롬프팅은 LLM이 전체 과제를 동시에 고려하는 대신 한 번에 한 단계씩 문제 해결에 집중하도록 장려합니다. 이 접근 방식은 LLM의 추론 능력을 증대시켜 보다 체계적이고 실용적인 문제 해결 프로세스를 촉진합니다.
Chain of Thought 프롬프팅의 유형
Chain-of-Thought (CoT) 프롬프팅 영역에서는 두 가지 효과적인 전략이 등장했으며, 둘 다 대규모 언어 모델(LLM)과의 상호 작용을 향상시키는 데 중요합니다. 이제 이러한 방법의 복잡성을 살펴보겠습니다:
멀티모달 CoT
멀티모달 CoT 프롬프팅은 이미지, 오디오 또는 비디오를 포함한 다양한 입력 모드를 통합하여 기존의 텍스트 기반 상호 작용에 역동적인 요소를 주입합니다.
사용자는 멀티모달 프롬프트를 제공하여 체인을 시작하며, LLM이 해석하고 해결할 수 있는 보다 복잡한 맥락을 제시합니다. 후속 프롬프트는 다양한 양식을 추가로 통합하여 사용자 입력에 대한 더 깊은 이해를 촉진할 수 있습니다. 다양한 양식을 포함하면 맥락이 향상되어 모델이 사용자 의도의 미묘한 차이를 더 잘 파악할 수 있습니다. 멀티모달 입력은 LLM에서 더 창의적인 응답을 이끌어낼 수 있어 다양하고 맥락적으로 관련성 높은 콘텐츠를 생성할 수 있는 범위를 넓힙니다.
멀티모달 언어 모델에 대한 자세한 정보를 원하신다면 당사 블로그를 확인하세요: 대규모 멀티모달 모델(LMM): AI 세계의 거대한 도약
최소에서 최대로 프롬프팅 (Least-to-Most Prompting)
최소에서 최대로 프롬프팅은 최소한의 프롬프트로 체인을 시작하고 후속 프롬프트에서 점진적으로 복잡성을 증가시키는 전략입니다. 상호 작용은 기본적이고 광범위한 프롬프트로 시작하여 모델이 초기 응답을 제공할 수 있도록 합니다. 체인이 전개됨에 따라 사용자는 점차적으로 더 많은 세부 사항, 사양 또는 복잡성을 도입하여 모델을 보다 미묘하고 정확한 출력으로 유도할 수 있습니다. 이러한 점진적 접근 방식은 모델의 이해를 점진적으로 향상시켜 상호 작용 초기에 오해의 위험을 완화합니다.
최소에서 최대로 프롬프팅을 통해 사용자는 모델의 초기 응답에 따라 작업의 복잡성을 조정할 수 있어 보다 개인화되고 실용적인 상호 작용을 보장합니다.
Auto-CoT 구현
Auto-CoT는 두 가지 주요 단계로 구성됩니다:
- 제공된 데이터 세트의 질문을 8개의 클러스터로 분할합니다 — sentence-BERT를 사용하여 질문을 인코딩한 후 코사인 유사성에 따라 클러스터를 설정합니다.
- 각 클러스터에서 대표 질문을 선택하고 Zero-Shot-CoT와 간단한 휴리스틱을 사용하여 추론 체인을 만듭니다 — 이러한 휴리스틱은 60개 토큰을 초과하는 질문이나 5단계 이상의 추론 체인을 선택하지 않는 것을 수반합니다. 이러한 휴리스틱은 자동 생성된 응답이 정확할 가능성을 높이기 위해 설계되었습니다.

Chain-of-Thought 프롬프팅의 응용 분야
Chain-of-Thought (CoT) 프롬프팅은 다양한 영역에 걸쳐 응용되며, 대규모 언어 모델(LLM)의 역량을 증대시키는 다재다능함을 강조합니다. 다음은 예시와 함께 몇 가지 주목할 만한 응용 분야입니다:

산술 추론
언어 모델이 수학 단어 문제를 해결하는 어려움은 잘 알려져 있습니다. CoT 프롬프팅은 5400억 개의 매개변수 언어 모델과 통합하여 MultiArith 및 GSM8K와 같은 벤치마크에서 비슷하거나 우수한 성능을 달성합니다. CoT를 통해 모델은 산술 추론 작업을 효과적으로 처리하며, 특히 더 큰 모델 크기에서 뛰어납니다. 이 응용은 CoT가 수학적 문제 해결 능력을 향상시키는 능력을 강조합니다.
상식 추론
상식 영역에서 언어 모델의 추론 능력을 향상시키는 CoT의 영향은 이 응용에서 분명하게 드러납니다. 상식 추론 작업은 일반 지식을 기반으로 물리적 및 인간 상호 작용을 이해하는 것을 포함하며, 자연어 이해 시스템에 어려움을 줄 수 있습니다. CoT 프롬프팅은 CommonsenseQA, StrategyQA, 날짜 이해, 스포츠 이해와 같은 작업에서 효과적인 것으로 입증되었습니다. 모델 크기는 일반적으로 성능에 영향을 미치지만, CoT는 추가적인 향상을 도입하며 특히 스포츠 이해 작업에서 이점을 제공합니다.
기호 추론
기호 추론 작업은 특히 표준 프롬프팅 방법을 사용할 때 언어 모델에 장애물이 되는 경우가 많습니다. 그러나 CoT 프롬프팅은 LLM이 마지막 글자 연결 및 동전 던지기와 같은 작업을 인상적인 해결률로 처리할 수 있도록 지원합니다. 이는 기호 추론을 촉진하고 길이 일반화에 도움을 주어 모델이 추론 중 더 긴 입력을 처리할 수 있게 합니다. 이 응용은 모델이 복잡한 기호 추론 작업을 실행하는 능력을 향상시키는 CoT의 중요한 잠재력을 강조합니다.
질문 응답 (QA)
CoT 프롬프팅은 복잡한 질문을 논리적 단계로 분해하여 질문 응답(QA)을 향상시킵니다. 이 방법론은 모델이 질문의 구조와 요소 간의 상호 연결을 이해하는 데 도움을 줍니다. CoT는 모델이 다양한 출처에서 정보를 반복적으로 수집하고 통합하는 다중 홉 추론을 촉진합니다. 이 반복적 과정은 추론 향상과 더 정확한 답변을 가져옵니다. 추론 단계를 설명함으로써 CoT는 응답의 일반적인 오류와 편향을 완화합니다. QA에서 CoT의 응용은 복잡한 문제를 분해하여 언어 모델의 추론과 이해를 개선하는 효과를 강조합니다.
한계 및 미래 방향
CoT 프롬프팅이 잠재력을 가지고 있지만, 단점이 없는 것은 아닙니다. 주로 약 1000억 개의 매개변수를 가진 모델에서만 성능 향상을 보여줍니다. 반대로, 소규모 모델은 종종 비합리적인 사고 체인을 생성하여 기존 프롬프팅 방법에 비해 정확도가 감소합니다. 또한 CoT 프롬프팅의 효능 향상은 일반적으로 모델의 크기와 상관관계가 있습니다.
이러한 한계에도 불구하고 CoT 프롬프팅은 LLM의 추론 능력을 향상시키는 데 있어 주목할 만한 발전을 나타냅니다. 후속 연구 노력은 이 접근 방식을 연마하고 다양한 작업 및 모델 차원에서 효과를 강화할 수 있는 방법을 탐구하는 데 집중될 것입니다.
결론
Chain-of-Thought (CoT) 프롬프팅은 특히 대규모 언어 모델(LLM)의 추론 능력을 증대시키는 데 있어 인공지능 분야의 중요한 돌파구로 자리 잡고 있습니다. 이러한 모델이 추론 과정을 설명하도록 유도함으로써 CoT는 산술, 상식 및 기호 추론을 요구하는 복잡한 작업 전반에서 성능을 향상시킬 수 있는 잠재력을 입증했습니다. 한계에도 불구하고 CoT는 LLM의 미래 진화에 유망한 전망을 예고합니다.
LLM의 능력 경계를 확장함에 따라 CoT 프롬프팅과 같은 기술은 필수 불가결하게 될 것입니다. 단계별 사고 접근 방식을 조성하고 추론 설명을 장려함으로써 우리는 복잡한 작업에서 모델 성능을 향상시킬 뿐만 아니라 내부 메커니즘에 대한 귀중한 통찰력을 얻습니다. 완전한 추론 LLM을 달성하는 길은 아직 멀지만, CoT 프롬프팅과 같은 방법론은 의심할 여지 없이 우리를 올바른 궤도에 올려놓습니다.
novita.ai는 100개 이상의 API에 대한 액세스를 제공하는 무한한 창의성을 위한 원스톱 플랫폼입니다. 이미지 생성 및 언어 처리부터 오디오 향상 및 비디오 조작까지, 저렴한 종량제 요금제로 GPU 유지 관리의 번거로움 없이 자체 제품을 구축할 수 있습니다. 지금 무료로 사용해 보세요.
추천 자료
