• history 관리를 통한 후속질문에 대한 문맥고려 응답
  • 토큰 비용 절감 및 지연 최적화를 위한 캐싱 전략
  • 하이브리드 검색을 통한 rag검색 고도화(코드소개만)