본문 바로가기

Dev Stories/AI|ML(인공지능|머신러닝)

[AI] RAG로 LLM 서비스 구성 과정 (키워드만)

반응형

Load

문서 로딩: 문서(pdf, word), RAW Data, 웹 페이지, Markdown, Notion 등 데이터 읽기

Split

분할: 불러온 문서를 chuck 단위로 분할

Embedding

임베딩: 문서를 벡터 표현으로 변환

VectorStore

벡터DB: 변환된 벡터를 DB에 저장

Retrieval

검색: 유사도 검색(similarity, mmr), Multi-Query, Multi-Retriever

Prompt

프롬프트: 검색된 결과를 바탕으로 원하는 결과를 도출하기 위한 프롬프트

Model

모델: LLM 모델 선택

Output

결과: 텍스트, JSON, Markdown

 

반응형