• RAG정의

    • Retrieval-Augmented Generation(검색-증강-생성)
    • LLM이 답변을 만들기 전에 외부 지식(문서/DB/웹/사내 위키 등)에서 관련 내용을 찾아(검색) 근거 컨텍스트로 더 정확하고 최신의 답을 생성하게 하는 패턴
  • RAG의 사용이유

    image.png

    • 사용자의 자연어 질의와 유사한 답변을 찾기 위함(RDB사용불가)
    • LLM은 사내정책/사내문서 등의 정보를 정확히 알고 있지 못함(환각 감소)
    • 최종흐름 : 사내정책문서를 임베딩하여 벡터db에 저장 → 사용자의 질문 → 사용자 질의를 벡터DB의 문서 중에 검색 → 검색된 결과를 LLM에 넘겨 최종 응답 생성
  • RAG의 핵심요소 3가지

    • vectorDB, LangChain, LLM가 RAG 아키텍처의 핵심요소

      image.png

    • vectorDB

      • 텍스트(단어/문장)을 컴퓨터가 다룰 수 있는 연속적인 숫자를 저장하는 공간
      • 우리 수업에서는 pgvector DB 활용 예정
    • LangChain

      • LLM 호출/응답, VectorDB에 저장/검색 등 일련의 작업을 쉽게 해주는 프레임워크
    • LLM

      • 우리 수업에서는 openai 기반 분류/응답 처리 작업 수행