인공지능(AI) 및 생성형 인공지능/AI 주요 기술

<문 1> RAG 개념 및 Vector RAG, Graph RAG 비교

최술사 2026. 3. 6. 16:48

<답>

1. 개요

  • RAG(Retrieval-Augmented Generation)는 외부 지식 검색 결과를 생성형 AI 입력에 결합해 최신·정확한 답변을 생성하는 아키텍처
  • Vector RAG는 벡터 임베딩 기반 유사도 검색, Graph RAG는 그래프 구조 기반 관계 검색에 특화되어, 도메인 구조와 질문 난이도에 따라 선택 및 혼용

2. RAG, Vector RAG 및 Graph RAG

가. 개념

구분 주요 내용
RAG 
  • RAG는 질문→관련 문서 검색→LLM에 함께 입력→답변 생성의 파이프라인으로, 모델 파라미터 밖의 지식을 실시간 활용하는 프레임워크
  • 내부 파라미터 지식 한계를 극복하고, 도메인 문서·DB·API 등 다양한 외부 지식 소스를 통합하는 것이 핵심
Vector RAG 
  •  문서,단락,문장을 임베딩 벡터로 변환 후, 질문 벡터와의 거리(코사인, dot 등)를 이용해 상위 k개 문서를 검색하는 방식
  • 대규모 비정형 텍스트에 적합하며, 인덱스 구축이 비교적 단순하고 기존 검색 인프라와 결합이 용이
Graph RAG
  •  엔티티(노드)와 관계(엣지)를 지식그래프로 구성하고, 질문과 연관된 노드·경로·서브그래프를 탐색해 근거 정보를 수집하는 방식
  • 관계성, 경로, 제약 조건이 중요한 복잡 질의(원인,결과,연쇄 의존성)에서 정확한 추론과 근거 설명에 유리
  •  

나. 구성도

  • RAG 구성도

구분 주요 내용
질의 입력(Q) 사용자가 자연어로 질문 입력
 검색 모듈(R) Vector RAG이면 벡터DB로 유사도 검색, Graph RAG이면 지식그래프 엔진으로 관련 노드 및 경로 검색
 컨텍스트 구성(C) 검색된 문서·노드 설명을 정제 및 요약해 프롬프트 컨텍스트로 구성
생성 모듈(G)  LLM이 Q+컨텍스트를 기반으로 답변 생성, 근거 문서/노드 ID를 함께 반환하도록 설계
  • Vector RAG 구성도

구분 주요 내용
문서 전처리 도메인 문서를 청크 단위로 분할(예: 512~1024 토큰)
임베딩 생성 각 청크를 임베딩 모델(전용,오픈소스)로 벡터화
벡터 인덱스 FAISS, HNSW, ScaNN 등 ANN 인덱스로 저장
검색 및 랭킹 질문 임베딩→유사도 검색→필요 시 reranker로 재정렬 후 상위 n개 청크를 LLM에 전달
  • Graph RAG 구성도

구분 주요 내용
 지식 추출 문서,로그,DB에서 엔티티 및 관계를 추출(NER, RE, 수동 모델링 병행)
그래프 구성 노드(사람, 시스템, 표준, 기능)와 엣지(종속, 인과, 포함)를 정의하고 속성 부여
그래프 질의 질의 의도를 해석해 관련 노드,이웃,경로 탐색, SPARQL와 Cypher,LLM 기반 NL2Query 활용
서브그래프 컨텍스트화 탐색된 노드와 연결된 설명 텍스트를 모아 LLM 입력에 결합
  • Vector+Graph 하이브리드 구성

  • 1차 Vector 검색으로 대략적 관련 문서 및 섹션을 찾음
  • 해당 범위에서 엔티티 추출 후 그래프 영역 축소
  • 축소된 서브그래프 기반 Graph RAG로 정밀 근거 및 관계 추론을 수행하는 2단 구조 구현 가능

다. 기술적 특징

구분 RAG  Vector RAG  Graph RAG 실무 적용
검색 단위 문서·청크·노드·경로 텍스트 청크(문장·단락) 엔티티·관계·경로 도메인 데이터 구조 고려
검색 방식 의미 기반 컨텍스트 검색 임베딩 유사도(ANN, kNN) 그래프 탐색(BFS, 경로 탐색, 질의 언어) 복잡 질의 여부 판단
장점 외부 지식 결합으로 최신성 확보 대규모 텍스트, 구현 간단, 확장 쉬움 관계·원인·제약 표현, 근거 설명력 우수 규정·아키텍처·프로세스 도메인 적합
단점 파이프라인 설계 복잡 긴 체인 관계, 논리 구조 표현에 한계 그래프 모델링·유지 비용 높음 초기 모델링/운영 비용 고려
활용 QA, 검색+생성, 요약·리라이팅 FAQ, 기술문서 Q&A, 로그 분석, 코드 검색 정책·규격 해석, 아키텍처 분석, 원인·영향 분석 프로젝트 특성별 혼합 설계
  • 도메인 구조화 수준과 질의 복잡도(단순 FAQ 및 규격·관계 추론)에 따라 Vector RAG 단독,Graph RAG,하이브리드 구조를 설계하는 것이 핵심

3. RAG, Vector RAG 및 Graph RAG 비교

구분 RAG Vector RAG Graph RAG
개념 검색(외부 지식) + 생성(LLM)을 결합한 전체 아키텍처 패턴 문서/청크를 임베딩 벡터로 만들어 유사도 기반으로 컨텍스트를 검색하는 RAG 구현 엔티티·관계를 그래프로 모델링하고 그래프 탐색으로 컨텍스트를 찾는 RAG 구현
데이터 구조 문서·텍스트·DB 등 다양한 외부 지식 소스 전체를 포괄 평면 텍스트 청크 + 임베딩 벡터 인덱스(FAISS, HNSW 등) 노드(엔티티)·엣지(관계)로 구성된 지식그래프(KG, property graph 등)
검색 방식 “어떻게 검색할지”에 대해 특정 방식 제한 없음 질문 임베딩과의 코사인 유사도, 내적 등으로 상위 k개 청크 검색 그래프 질의 언어·경로 탐색(BFS, shortest path 등)로 관련 노드·경로·서브그래프 탐색
장점 외부 지식으로 최신성·정확성 향상, 다양한 소스 통합 가능 구현 단순, 대규모 텍스트에 적합, 스케일·성능 튜닝 용이 관계·경로·제약을 명시적으로 표현, 원인·영향 등 구조적 추론과 근거 설명에 강함
단점 파이프라인 설계·튜닝이 필요, 검색 품질에 따라 성능 편차 관계 구조 표현이 약해 복잡한 연쇄 추론·제약 조건 표현에 한계 그래프 모델링·지속적인 관리 비용 큼, 초기 구축 난이도 높음
적합한 질의 유형 일반 QA, FAQ, 검색+요약, 도메인 문서 기반 질의 전반 “~이 무엇인가?”, “어떻게 하는가?” 등 유사 문서·설명 검색형 질의 “무엇과 무엇의 관계?”, “원인/결과/영향은?”, “이 변경의 영향 범위는?” 등 관계 중심 질의
구축 난이도 개념적 프레임워크 수준, 세부 구현에 따라 천차만별 상대적으로 낮음(임베딩 모델 + 벡터DB 구축 중심) 상대적으로 높음(지식 추출, 스키마 설계, 그래프 구축·정제 필요)
운영·확장 검색 모듈 교체·추가, 캐시·로그 기반 품질 개선 등으로 점진적 고도화 가능 인덱스 증분 업데이트, 샤딩·복제 등으로 스케일 아웃 쉬움 그래프 크기 증가에 따른 성능·일관성 관리가 중요, 정기 정제·리빌딩 전략 필요
설명 가능성 근거 문서·청크 수준의 출처 제공 가능 “어떤 문단에서 가져왔는지” 정도 근거 제공에 적합 “어떤 엔티티가 어떤 관계를 통해 연결되었는지”까지 경로 기반 근거 설명 가능
활용 예시 사내 지식검색, 고객 상담, 매뉴얼 QA, 코드/로그 분석 등 기술 문서/표준 문서 FAQ, 로그 검색, 코드 검색, 일반 업무 지식검색 정책·규정 해석, 시스템 아키텍처 의존성, 변경 영향 분석, 규제·법규 관계 분석 등

4. 활용 및 기술 동향

  • 사내 규정,표준 및 아키텍처 문서는 Vector RAG로 1차 검색, 핵심 엔티티·시스템 간 관계를 Graph로 모델링해 변경 영향 분석·원인 분석에 Graph RAG 적용하는 하이브리드 패턴이 실무에 적합
  • 벡터,그래프,전통 키워드 검색을 통합한 멀티모달 RAG, 에이전트형 RAG(계획 및 도구 호출 포함), 스키마 자동 추출 기반 Graph RAG 자동화 등으로 발전 중이며, 대규모 도메인에서는 검색 정확도+근거 추적 요구로 Graph RAG 도입 검토가 확대되는 추세

<끝>