RAG정의
Retrieval-Augmented Generation(검색-증강-생성)
LLM이 답변을 만들기 전에 외부 지식(문서/DB/웹/사내 위키 등)에서 관련 내용을 찾아(검색) 근거 컨텍스트로 더 정확하고 최신의 답을 생성하게 하는 패턴
RAG의 사용이유
사용자의 자연어 질의와 유사한 답변을 찾기 위함(RDB사용불가)
LLM은 사내정책/사내문서 등의 정보를 정확히 알고 있지 못함(환각 감소)
최종흐름 : 사내정책문서를 임베딩하여 벡터db에 저장 → 사용자의 질문 → 사용자 질의를 벡터DB의 문서 중에 검색 → 검색된 결과를 LLM에 넘겨 최종 응답 생성
RAG의 핵심요소 3가지
vectorDB, LangChain, LLM가 RAG 아키텍처의 핵심요소
vectorDB
텍스트(단어/문장)을 컴퓨터가 다룰 수 있는 연속적인 숫자를 저장하는 공간
우리 수업에서는 pgvector DB 활용 예정
LangChain
LLM 호출/응답, VectorDB에 저장/검색 등 일련의 작업을 쉽게 해주는 프레임워크
LLM
우리 수업에서는 openai 기반 분류/응답 처리 작업 수행