요즘 AI 용어가 곳곳에 퍼져 있는데, 모두가 다른 언어를 쓰는 것처럼 느껴질 때가 많습니다. 회의 중에 누군가 “샌드박스” 나 “RAG” 또는 “MCP” 를 언급할 때 고개만 끄덕이며 이 용어의 절반이 실제로 무엇을 의미하는지 속으로 궁금해한 적이 있다면, 이 가이드가 도움이 될 것입니다.
기술은 빠르게 발전하지만, 기본을 이해하는 데 기술적 배경이 필요하지는 않습니다. 여기 자주 접하게 될 가장 일반적인 AI 용어를 평이한 언어로 설명하고, 이해를 차근차근 쌓을 수 있도록 구성했습니다.

1. 핵심 AI 개념
AI 모델
AI 모델은 인간의 사고를 모방하도록 설계된 똑똑한 컴퓨터 프로그램이라고 생각하면 됩니다. 질문이나 이미지 같은 입력을 주면, 그 정보를 처리하여 의미 있는 출력을 생성합니다. 모델은 방대한 양의 예제를 분석하고 패턴을 인식하며 이해와 응답 능력을 점진적으로 향상시키는 방식으로 학습합니다.
AI 모델과 효율적인 배포 방법에 대해 더 자세히 알아보려면 Novita AI 모델 배포 가이드를 확인하세요.
신경망 (Neural Network)
신경망은 우리 뇌의 작동 방식을 단순화한 버전이라고 생각하면 됩니다. 상호 연결된 노드(인공 뉴런이라고 함)로 구성되어 있으며, 마치 우리 머릿속의 뉴런처럼 서로 정보를 전달합니다. 이 네트워크는 노드 간 연결의 가중치를 조정함으로써 패턴 인식과 의사 결정 능력을 향상시킵니다. 이는 우리가 경험을 통해 학습하는 방식과 유사합니다. 신경망은 여러 계층으로 구성됩니다. 입력 계층은 데이터를 받고, 은닉 계층은 복잡한 수학 함수를 통해 데이터를 처리하며, 출력 계층은 최종 결과를 생성합니다. ‘딥(deep)’ 러닝에서 '딥’은 많은 은닉 계층을 가진 네트워크를 의미하며, 이를 통해 점점 더 복잡한 패턴을 학습할 수 있습니다.

트랜스포머 아키텍처 (Transformer Architecture)
트랜스포머는 오늘날의 똑똑한 AI를 가능하게 한 혁신적인 기술입니다. 2017년 이전에는 AI가 텍스트를 단어 단위로 읽어야 했습니다. 마치 한 단어씩 손가락으로 짚어가며 책을 읽는 것과 같았죠. 트랜스포머는 '어텐션(attention)'이라는 메커니즘을 통해 AI가 문장의 모든 단어를 동시에 보고 단어 간의 관계를 이해할 수 있도록 변화시켰습니다. 이는 한 번에 한 단어씩 읽는 것과 전체 문장을 즉시 파악하는 것의 차이와 같습니다. 어텐션 메커니즘은 모델이 출력의 각 부분을 생성할 때 입력의 관련 부분에 집중할 수 있게 해주어, 언어의 맥락과 관계를 이해하는 데 훨씬 더 효과적입니다.
대규모 언어 모델 (LLM)
LLM은 인간의 언어를 이해하고 생성하도록 특별히 훈련된 AI 모델입니다. 수십억 개의 단어를 읽고 문장에서 다음에 올 단어를 예측하는 법을 학습하여, 에세이를 쓰거나 질문에 답하거나 자연스러운 대화를 할 수 있습니다. 훈련 과정에서 텍스트의 패턴을 분석하여 문법, 맥락, 의미를 이해합니다. 최신 LLM은 멀티모달 모델로 발전하여 텍스트뿐만 아니라 이미지, 오디오 등도 하나의 인터페이스 안에서 처리할 수 있습니다. 예를 들어, GPT-4o는 텍스트, 음성, 이미지를 동시에 입력받을 수 있어 상호작용이 더욱 풍부하고 다양해졌습니다. '대규모(large)'는 모델의 학습된 지식을 저장하는 엄청난 수의 매개변수(종종 수십억 개)를 의미합니다.
인공 일반 지능 (AGI)
AGI는 AI의 성배와 같은 존재로, 특정 작업뿐만 아니라 모든 영역에서 인간처럼 똑똑한 시스템을 말합니다. 오늘날의 AI는 글쓰기나 이미지 인식 같은 특정 작업에 뛰어나지만, AGI는 창의성, 추론, 학습, 문제 해결 능력에서 모든 분야에 걸쳐 인간의 지능과 맞먹을 것입니다. 과학적으로 AGI를 달성하려면 전이 학습 (Transfer learning, 지식을 여러 영역에 적용), 퓨샷 학습 (Few-shot learning, 최소한의 예제로 학습), 인과 추론, 더 효율적인 학습 알고리즘 개발 등 근본적인 난제를 해결해야 합니다. 현재의 AI 시스템은 특정 작업에는 뛰어나지만 인간 인지의 특징인 일반 지능과 적응력이 부족하기 때문에 ‘좁은(narrow)’ AI로 간주됩니다.
AI 정렬 (AI Alignment)
AI 정렬은 AI 시스템이 인간이 원하는 것과 동일한 것을 원하고, 우리를 돕는 방식으로 행동하며 해를 끼치지 않도록 하는 것을 의미합니다. AI가 더 강력해짐에 따라 AI가 우리의 가치와 목표를 공유하도록 하는 것이 점점 더 중요해지고 있습니다. AI가 우리 편에 서도록 하는 것이라고 생각하면 됩니다. 여기에는 가치 학습 (Value learning, AI가 인간의 선호도를 이해하도록 가르치기), 견고성 (Robustness, 새로운 상황에서 AI가 올바르게 작동하도록 보장), 해석 가능성 (Interpretability, AI가 특정 결정을 내리는 이유 이해) 등의 기술적 과제가 포함됩니다. 정렬 연구는 또한 어떤 가치에 맞출 것인지, 상충되는 인간의 선호도를 어떻게 처리할 것인지와 같은 철학적 질문을 다룹니다.
2. 데이터와 훈련
훈련 데이터 (Training Data)
훈련 데이터는 AI 모델을 가르치는 데 사용되는 모든 정보입니다. AI의 교과서라고 생각하면 됩니다. 언어 모델의 경우 수백만 권의 책, 웹사이트, 뉴스 기사 및 기타 서면 콘텐츠가 포함됩니다. 이 '읽을거리’가 다양하고 고품질일수록 AI가 다양한 주제와 상황을 더 잘 처리할 수 있습니다. 데이터 품질은 매우 중요합니다. 편향되거나 부정확한 훈련 데이터는 편향되거나 부정확한 AI 출력으로 이어집니다. 훈련 과정은 모델에게 수많은 예제를 보여주어 데이터 내의 통계적 패턴과 관계를 학습하도록 하는 것입니다.
사전 훈련 (Pre-training)
사전 훈련은 AI가 초등학교에 가는 것과 같습니다. 모델이 기본을 배우는 단계입니다. 이 단계에서 AI는 방대한 양의 텍스트를 읽고 언어의 기본 패턴, 세상에 대한 사실, 추론 방법 등을 학습합니다. 이는 본질적으로 AI가 특정 분야에 특화되기 전에 받는 일반 교육입니다. 사전 훈련은 비지도 학습을 사용하므로 모델이 명시적인 레이블이나 답변 없이 패턴을 학습합니다. 이 단계는 계산 비용이 많이 들어 강력한 컴퓨터 클러스터에서 수주 또는 수개월이 걸리는 경우가 많지만, 다양한 작업에 적용할 수 있는 일반 지식의 기초를 만듭니다.
미세 조정 (Fine-tuning)
미세 조정은 졸업 후의 전문 교육과 같습니다. AI가 사전 훈련을 통해 일반 교육을 마친 후, 특정 유형의 콘텐츠나 작업에 대해 추가로 훈련될 수 있습니다. 예를 들어, 일반 AI는 의료 관련 질문에 더 능숙해지도록 의학 저널로 미세 조정되거나, 회사의 특정 어조와 스타일을 채택하도록 고객 서비스 대화로 훈련될 수 있습니다. 이 과정은 모델이 언어의 기본을 이미 이해하고 있기 때문에 사전 훈련보다 훨씬 적은 데이터와 계산 리소스가 필요합니다. 미세 조정은 일반적인 능력을 유지하면서 특정 도메인이나 애플리케이션에 맞게 성능을 최적화하기 위해 모델의 매개변수를 조정합니다.
인간 피드백 기반 강화 학습 (RLHF)
RLHF는 인간 교사가 AI의 숙제를 채점하고 좋은 답이 무엇인지 알려주는 것과 같습니다. 인간은 다양한 AI 응답을 평가하고, 모델은 사람들이 유용하고 정확하며 적절하다고 생각하는 출력을 생성하는 법을 배웁니다. 이 과정은 AI 시스템이 우리가 원하는 방식으로 작동하도록 만드는 데 매우 중요합니다. RLHF는 일반적으로 세 단계로 진행됩니다. 인간의 선호도에 기반한 보상 모델 훈련, 강화 학습을 사용하여 이 보상 모델에 따라 AI의 행동 최적화, 더 많은 인간 피드백을 통한 반복적 개선입니다. 이 기술은 AI 행동을 인간의 가치와 일치시키고 유해하거나 원치 않는 출력을 줄이는 데 도움이 됩니다.
3. 입력 및 출력 메커니즘
토큰 (Token)
토큰은 기본적으로 AI가 텍스트를 ‘세는’ 방식입니다. 대략 한 단어당 하나의 토큰이지만, 단어의 일부나 구두점, 심지어 공백일 수도 있습니다. AI 모델은 한 번에 처리할 수 있는 토큰 수에 제한(컨텍스트 윈도우라고 함)이 있어, 때로는 매우 긴 문서를 처리하거나 긴 대화의 모든 내용을 기억하지 못할 수 있습니다. 언어와 문자 체계에 따라 다른 토큰화 전략이 필요합니다. 토큰을 이해하는 것은 AI 모델이 텍스트를 토큰 단위로 순차적으로 처리하고, 토큰 제한이 대화 중 입력 길이와 기억 범위를 결정하기 때문에 중요합니다.
추론 (Inference)
추론은 AI가 실제 작업을 수행하는 순간입니다. 입력을 받아 출력을 생성하는 것입니다. ChatGPT에 질문을 입력하고 답변을 받을 때, 바로 추론이 일어나고 있는 것입니다. 이는 AI가 데이터로부터 학습하는 훈련과는 다릅니다. 추론 중에는 모델이 학습된 매개변수를 사용하여 새 입력을 처리하고 응답을 생성합니다. 이 과정은 훈련보다 훨씬 빠르고 리소스를 덜 사용하지만, 대규모 모델의 경우 여전히 상당한 계산 성능이 필요합니다. 추론의 품질은 모델의 훈련과 입력이 모델이 이전에 본 패턴과 얼마나 잘 일치하는지에 따라 달라집니다.
프롬프트 엔지니어링 (Prompt Engineering)
프롬프트 엔지니어링은 AI에게 올바른 방식으로 올바른 질문을 하는 기술이자 과학입니다. 사람에게 막연한 질문보다 명확하고 구체적인 질문을 하면 더 나은 답변을 얻을 수 있는 것처럼, 좋은 프롬프트를 작성하면 AI로부터 얻는 결과를 극적으로 향상시킬 수 있습니다. 효과적인 프롬프트에는 명확한 지침, 관련 맥락, 원하는 출력 형식의 예제, 특정 제약 조건이나 요구 사항이 포함되는 경우가 많습니다. 고급 기술로는 체인 오브 소트 프롬프팅 (Chain-of-thought prompting, AI가 추론 과정을 보여주도록 요청), 퓨샷 학습 (Few-shot learning, 예제 제공), 프롬프트 체이닝 (Prompt chaining, 복잡한 작업을 여러 단계로 나누기) 등이 있습니다. 목표는 모델의 능력을 최적으로 활용하면서 의도를 명확하게 전달하는 것입니다.
환각 (Hallucination)
AI가 '환각’을 일으킬 때, 그럴듯하게 들리지만 사실이 아닌 내용을 지어내는 것입니다. 이는 AI가 지식의 공백을 메우려고 하거나 실제로 이해하지 못하는 것에 대해 질문을 받을 때 발생합니다. 자신이 한 번도 가본 적 없는 곳으로 가는 길을 자신 있게 알려주는 사람과 비슷합니다. 자신감이 길 안내의 정확성을 보장하지는 않습니다. 환각은 언어 모델이 정확한 정보보다는 그럴듯하게 들리는 텍스트를 생성하도록 훈련되었기 때문에 발생합니다. 모델은 자신감 있는 어조를 유지하면서 사실, 인용, 세부 사항을 조작할 수 있습니다. 이 한계를 이해하는 것은 책임감 있는 AI 사용에 필수적이며, 사실 확인 및 출처 검증과 같은 기술이 여전히 중요합니다.

4. AI 도구 및 고급 응용
응용 프로그램 프로그래밍 인터페이스 (API)
API는 레스토랑의 웨이터와 같습니다. 주문(요청)을 주방(AI 시스템)에 전달하고 음식(응답)을 가져옵니다. AI 세계에서 API는 서로 다른 소프트웨어 프로그램이 AI 모델과 대화할 수 있게 해주며, AI를 처음부터 구축할 필요가 없습니다. 기업은 API를 통해 기존 AI 서비스에 연결할 수 있습니다. API는 최대 출력 길이, 창의성 수준 (온도, temperature), 응답 형식과 같은 매개변수를 포함하여 요청과 응답의 특정 형식을 정의합니다. 또한 인증, 속도 제한, 오류 관리를 처리하여 개발자가 깊은 AI 전문 지식 없이도 AI 기능을 애플리케이션, 웹사이트 또는 서비스에 쉽게 통합할 수 있도록 합니다.
멀티모달 AI (Multimodal AI)
멀티모달 AI는 텍스트, 이미지, 음성, 비디오 등 다양한 유형의 콘텐츠를 동시에 처리할 수 있습니다. 이는 당신이 보여주는 것을 보고, 말하는 것을 듣고, 쓴 것을 읽을 수 있는 사람과 대화하는 것과 같습니다. 이로 인해 AI 상호작용이 훨씬 더 자연스럽고 인간적으로 느껴집니다. 멀티모달 모델은 다양한 입력 유형(이미지용 비전 트랜스포머, 소리용 오디오 인코더)에 서로 다른 신경망 아키텍처를 사용하지만, 이를 통합된 표현 공간에서 결합합니다. 이를 통해 AI는 비디오에서 무슨 일이 일어나고 있는지 설명하거나 이미지에 대한 질문에 답하는 등 여러 양식 간의 관계를 이해할 수 있습니다.
검색 증강 생성 (RAG)
RAG는 AI가 질문에 답하는 동안 최신 도서관에 접근할 수 있도록 하는 것과 같습니다. RAG 시스템은 훈련 중에 학습한 내용만 사용하는 대신, 응답을 생성하기 전에 최신 데이터베이스와 문서를 검색하여 관련 정보를 찾을 수 있습니다. 이는 답변이 정확하고 최신인지 확인하는 데 도움이 됩니다. RAG는 두 단계로 작동합니다. 먼저 검색 시스템이 질문을 기반으로 관련 문서나 정보를 검색한 다음, 언어 모델이 훈련 지식과 검색된 정보를 모두 사용하여 응답을 생성합니다. 이 접근 방식은 환각을 줄이고, 최신 정보에 접근할 수 있게 하며, AI가 독점적이거나 전문적인 지식 베이스와 함께 작업할 수 있도록 합니다.
이 글을 통해 더 자세히 알아보세요: RAG란 무엇인가: 검색 증강 생성에 대한 포괄적인 소개
샌드박스 (Sandbox)
샌드박스는 AI를 위한 안전한 놀이터와 같습니다. AI가 코드를 실행하거나, 도구에 접근하거나, 주요 시스템에 어떤 위험도 초래하지 않고 실험할 수 있는 안전하고 격리된 환경입니다. 아이가 중요한 것을 망가뜨릴 수 없는 제한된 구역에서 노는 것과 같습니다. 샌드박스는 컨테이너화, 가상 머신 또는 기타 격리 기술을 사용하여 시스템 리소스, 네트워크 연결 및 민감한 데이터에 대한 접근이 제한된 통제된 환경을 만듭니다. 이를 통해 AI 에이전트가 코드를 실행하고, API와 상호 작용하거나, 솔루션을 테스트하면서 잠재적인 보안 위반, 데이터 손상 또는 시스템 손상을 방지할 수 있습니다.
이것은 다소 복잡한 개념입니다. 더 자세히 알고 싶다면, 저희의 훌륭한 글을 통해 더 깊이 살펴보세요: 에이전트 샌드박스가 안전하고 확장 가능한 AI 혁신을 지원하는 방법.
LLM 전용 엔드포인트 (LLM Dedicated Endpoint)
LLM 전용 엔드포인트는 특정 AI 모델에 대한 전화 직통 전화기를 갖는 것과 같습니다. 모든 사람과 리소스를 공유하는 대신, 특정 사용 사례에 맞게 사용자 정의할 수 있는 전용 연결을 얻습니다. 여기에는 응답 속도, 출력 스타일, 안전 필터, 성능 보장과 같은 사용자 정의 구성을 통해 격리된 컴퓨팅 리소스(GPU, 메모리, 대역폭)를 설정하는 것이 포함됩니다. 전용 엔드포인트는 일관된 지연 시간, 더 높은 처리량, 애플리케이션에 맞게 모델을 미세 조정할 수 있는 기능을 제공하며, 데이터 프라이버시를 보장하고 엔터프라이즈 보안 요구 사항을 충족합니다.
이 글을 통해 더 자세히 알아보세요: Novita AI의 LLM 전용 엔드포인트: 맞춤형 모델, 사용량 기반 가격, DevOps 없는 확장.
모델 컨텍스트 프로토콜 (MCP)
MCP는 AI 모델이 외부 도구 및 서비스와 일관된 방식으로 연결할 수 있게 해주는 새로운 표준입니다. AI는 이제 텍스트를 생성하는 것 외에도 회의 일정을 잡고, 캘린더를 업데이트하거나, 데이터베이스에서 정보를 가져올 수 있습니다. 기술적인 관점에서 MCP는 정의된 인터페이스와 권한을 통해 AI가 다양한 소프트웨어 시스템과 안전하게 상호 작용할 수 있도록 하는 표준화된 통신 프로토콜을 만듭니다. 이는 AI를 수동적인 응답자에서 제어된 접근 패턴과 감사 추적을 통해 보안을 유지하면서 실제 조치를 취할 수 있는 능동적인 조수로 변화시킵니다.
여기 도움이 되는 글이 있습니다: MCP란 무엇인가? 모델 컨텍스트 프로토콜에 대한 개발자 가이드.
인공지능은 기초 개념, 고급 도구, 윤리적 고려 사항을 결합하여 산업을 혁신할 수 있는 강력한 시스템을 만드는 빠르게 진화하는 분야입니다. AI가 계속 발전함에 따라 그 개념과 응용에 대한 정보를 지속적으로 업데이트하는 것이 AI의 잠재력을 최대한 활용하는 열쇠입니다. 실제 경험을 쌓는 것도 최신 개발 동향을 따라가고 실무 경험을 얻는 좋은 방법입니다.
제한된 기간 동안 신규 사용자는 Novita AI에서 LLM API를 탐색하고 구축할 수 있는 $10의 무료 크레딧을 받을 수 있습니다. AI 세계에 뛰어들어 아이디어를 현실로 만들 수 있는 이 기회를 놓치지 마세요!
Novita AI 소개
Novita AI는 개발자가 간단한 API를 사용하여 AI 모델을 쉽게 배포할 수 있도록 하고, 경제적이고 안정적인 GPU 클라우드를 제공하여 구축과 확장을 지원하는 AI 클라우드 플랫폼입니다.
