RAG 파이프라인 설계: 검색 품질을 올리는 7가지 원칙
2026년 2월 14일
RAG 서비스의 성능은 모델보다 검색 파이프라인에서 먼저 결정됩니다. 같은 모델을 쓰더라도 데이터 구성 방식에 따라 체감 품질이 크게 달라집니다.
청킹 전략
문서 구조를 무시한 고정 길이 청킹은 문맥 손실을 만듭니다. 제목/섹션 단위 청킹과 오버랩을 조합하면 정답 문맥 회수율이 높아집니다.
하이브리드 검색
벡터 검색만으로는 키워드 정확 매칭이 약할 수 있습니다. BM25와 벡터 검색을 결합하면 정확도와 재현율을 동시에 개선할 수 있습니다.
재랭킹과 근거 제시
상위 후보 문서를 재랭킹해 문맥 품질을 높이고, 응답에는 출처를 함께 제시해야 사용자 신뢰를 얻을 수 있습니다.
RAG를 제대로 운영하려면 검색 지표(NDCG, Recall@K)와 생성 지표를 분리해 측정해야 합니다. 이 분리가 품질 개선 속도를 결정합니다.