[생성AI] 핵심기술 이해

● LLM (Large, Language Model, 거대 언어 모델)

대규모의 데이터셋에서 학습된 거대한 인공지능 언어모델

특징	설명
대규모 데이터 학습	인터넷상의 수십억 단어로부터 다양한 주제와 언어 패턴 파악
다채로운 언어 능력	단순한 텍스트 생성 뿐만 아니라 문맥 요약, 번역, 감성 분석 가능
사전학습과 미세조정	대부분의 LLM은 사전학습과 미세조정 두단계로 진행

● 사전 학습 (Pre-trained)

특정 작업 전 대규모 데이터를 사용해 기본 구조와 지식, 패턴 등을 미리 학습시키는 과정

*예시 : GPT는 "The capital of France is ___"에 "Paris"라고 답할 수 있도록 수많은 문장을 통해 학습됨.

● 미세 조정 (Fine-tuning)

사전 학습한 모델에 특정 목적, 분야, 문체에 맞게 추가 학습을 시키는 단계

*예시 : AI 상담봇이 고객센터 대화 데이터를 기반으로 미세조정

● 랭체인 (LangChain)

- 거대 언어모델을 활용하여 AI 기반 애플리케이션을 개발할 수 있도록 돕는 프레임워크

- RAG를 활용한 검색 증강과 에이전트를 통한 자동화 기능이 강한 특징

*예시 : ‘시간+고객+채팅 기능이 있는 AI 비서’를 만들 때, 각 요소를 연결해주는 역할

요약

예시

사전학습-미세조정-랭체인 개념은

서로 연결되며, 이는 곧 생성 AI의

‘훈련–응용–사용’ 흐름을 구성

- 생성AI 모델은 사전학습됨

- 기업이 AI를 미세조정해 고객센터 챗봇용으로 만듦

- 랭체인으로 데이터베이스와 연결

- 사용자가 "배송 지연 문의"라는 프롬프트로 질문

i-loom