LLM

LLM

[LLM] RAG 앱 구현하기 - LM Studio 서버 연동

업무를 하면서 나중에 참고하거나 인수인계에 필요한 자료들을 많이 만들게 되는데,문제는 어느 파일에 저장했는지 기억이 나지 않는 경우가 많다. (필자는 절대 아니다.)부랴부랴 뒤적거리면 나오기는 하지만, 시간이 제법 걸릴 수 있다. 그래서 이 문서 검색을 빠르게 할 수 있도록 로컬 LLM을 사용하여 RAG 앱?을 구현해보기로 했다. 클라우드 LLM (웹에서 사용하는 GPT나 클로드 등)은 프리이버시 이슈가 있어서 로컬 LLM을 선택했다. RAG 동작원리와 용어 일단 프로세스는문서 정리 : 원본 문서 > 전처리 > 청킹 > 임베딩 > 벡터 DB에 저장 (인덱싱)검색 : 사용자 질문 > 임베딩 > 벡터 DB 검색 > LLM에 프롬프트(검색된 문서 + 질문) 전송 > 답변 생성이런 식이라고 생각하면 된다. ...

LLM

[LLM] API 동작 원리 및 개념

뜬금 없지만 LLM에 흥미가 생겨서 동작 원리를 찾아봤다.아래 내용은 Gemini에게 질문을 해서 받아낸(?) 내용이다. LLM API의 핵심 동작 원리와 개념 3가지우리가 만든 앱이 OpenAI 서버와 대화하는 과정은 크게 [입력 준비] → [추론] → [출력 생성] 으로 나뉩니다.각 단계별 핵심 개념을 알아보겠습니다. 1. 입력 준비 단계: "컴퓨터가 알아들을 수 있는 언어로 번역하기"사람의 언어("오늘 날씨 어때?")를 컴퓨터가 바로 이해할 수는 없습니다. 그래서 컴퓨터가 계산할 수 있는숫자 형태로 바꿔주는 과정이 필요합니다. 핵심 개념 1: 토큰 (Tokens)LLM이 텍스트를 처리하는 기본 의미 단위입니다. 보통 단어 1개나, 더 작게는 단어의 일부(ing, ed 등)가 1개의 토큰이 됩니다. ..

제법 멋진 개발자
'LLM' 카테고리의 글 목록