[LLM] RAG 앱 구현하기 - LM Studio 서버 연동
업무를 하면서 나중에 참고하거나 인수인계에 필요한 자료들을 많이 만들게 되는데,문제는 어느 파일에 저장했는지 기억이 나지 않는 경우가 많다. (필자는 절대 아니다.)부랴부랴 뒤적거리면 나오기는 하지만, 시간이 제법 걸릴 수 있다. 그래서 이 문서 검색을 빠르게 할 수 있도록 로컬 LLM을 사용하여 RAG 앱?을 구현해보기로 했다. 클라우드 LLM (웹에서 사용하는 GPT나 클로드 등)은 프리이버시 이슈가 있어서 로컬 LLM을 선택했다. RAG 동작원리와 용어 일단 프로세스는문서 정리 : 원본 문서 > 전처리 > 청킹 > 임베딩 > 벡터 DB에 저장 (인덱싱)검색 : 사용자 질문 > 임베딩 > 벡터 DB 검색 > LLM에 프롬프트(검색된 문서 + 질문) 전송 > 답변 생성이런 식이라고 생각하면 된다. ...