LLM

[LLM] RAG 앱 구현하기 - LM Studio 서버 연동

2025.10.29

업무를 하면서 나중에 참고하거나 인수인계에 필요한 자료들을 많이 만들게 되는데,문제는 어느 파일에 저장했는지 기억이 나지 않는 경우가 많다. (필자는 절대 아니다.)부랴부랴 뒤적거리면 나오기는 하지만, 시간이 제법 걸릴 수 있다. 그래서 이 문서 검색을 빠르게 할 수 있도록 로컬 LLM을 사용하여 RAG 앱?을 구현해보기로 했다. 클라우드 LLM (웹에서 사용하는 GPT나 클로드 등)은 프리이버시 이슈가 있어서 로컬 LLM을 선택했다. RAG 동작원리와 용어 일단 프로세스는문서 정리 : 원본 문서 > 전처리 > 청킹 > 임베딩 > 벡터 DB에 저장 (인덱싱)검색 : 사용자 질문 > 임베딩 > 벡터 DB 검색 > LLM에 프롬프트(검색된 문서 + 질문) 전송 > 답변 생성이런 식이라고 생각하면 된다. ...

LLM

[LLM] API 동작 원리 및 개념

2025.08.01

뜬금 없지만 LLM에 흥미가 생겨서 동작 원리를 찾아봤다.아래 내용은 Gemini에게 질문을 해서 받아낸(?) 내용이다. LLM API의 핵심 동작 원리와 개념 3가지우리가 만든 앱이 OpenAI 서버와 대화하는 과정은 크게 [입력 준비] → [추론] → [출력 생성] 으로 나뉩니다.각 단계별 핵심 개념을 알아보겠습니다. 1. 입력 준비 단계: "컴퓨터가 알아들을 수 있는 언어로 번역하기"사람의 언어("오늘 날씨 어때?")를 컴퓨터가 바로 이해할 수는 없습니다. 그래서 컴퓨터가 계산할 수 있는숫자 형태로 바꿔주는 과정이 필요합니다. 핵심 개념 1: 토큰 (Tokens)LLM이 텍스트를 처리하는 기본 의미 단위입니다. 보통 단어 1개나, 더 작게는 단어의 일부(ing, ed 등)가 1개의 토큰이 됩니다. ..

[LLM] RAG 앱 구현하기 - LM Studio 서버 연동

[LLM] API 동작 원리 및 개념

티스토리툴바