<답>
1. 개요
- RAG(Retrieval-Augmented Generation)는 외부 지식 검색 결과를 생성형 AI 입력에 결합해 최신·정확한 답변을 생성하는 아키텍처
- Vector RAG는 벡터 임베딩 기반 유사도 검색, Graph RAG는 그래프 구조 기반 관계 검색에 특화되어, 도메인 구조와 질문 난이도에 따라 선택 및 혼용
2. RAG, Vector RAG 및 Graph RAG
가. 개념
| 구분 | 주요 내용 |
| RAG |
|
| Vector RAG |
|
| Graph RAG |
|
나. 구성도
- RAG 구성도

| 구분 | 주요 내용 |
| 질의 입력(Q) | 사용자가 자연어로 질문 입력 |
| 검색 모듈(R) | Vector RAG이면 벡터DB로 유사도 검색, Graph RAG이면 지식그래프 엔진으로 관련 노드 및 경로 검색 |
| 컨텍스트 구성(C) | 검색된 문서·노드 설명을 정제 및 요약해 프롬프트 컨텍스트로 구성 |
| 생성 모듈(G) | LLM이 Q+컨텍스트를 기반으로 답변 생성, 근거 문서/노드 ID를 함께 반환하도록 설계 |
- Vector RAG 구성도

| 구분 | 주요 내용 |
| 문서 전처리 | 도메인 문서를 청크 단위로 분할(예: 512~1024 토큰) |
| 임베딩 생성 | 각 청크를 임베딩 모델(전용,오픈소스)로 벡터화 |
| 벡터 인덱스 | FAISS, HNSW, ScaNN 등 ANN 인덱스로 저장 |
| 검색 및 랭킹 | 질문 임베딩→유사도 검색→필요 시 reranker로 재정렬 후 상위 n개 청크를 LLM에 전달 |
- Graph RAG 구성도

| 구분 | 주요 내용 |
| 지식 추출 | 문서,로그,DB에서 엔티티 및 관계를 추출(NER, RE, 수동 모델링 병행) |
| 그래프 구성 | 노드(사람, 시스템, 표준, 기능)와 엣지(종속, 인과, 포함)를 정의하고 속성 부여 |
| 그래프 질의 | 질의 의도를 해석해 관련 노드,이웃,경로 탐색, SPARQL와 Cypher,LLM 기반 NL2Query 활용 |
| 서브그래프 컨텍스트화 | 탐색된 노드와 연결된 설명 텍스트를 모아 LLM 입력에 결합 |
- Vector+Graph 하이브리드 구성

- 1차 Vector 검색으로 대략적 관련 문서 및 섹션을 찾음
- 해당 범위에서 엔티티 추출 후 그래프 영역 축소
- 축소된 서브그래프 기반 Graph RAG로 정밀 근거 및 관계 추론을 수행하는 2단 구조 구현 가능
다. 기술적 특징
| 구분 | RAG | Vector RAG | Graph RAG | 실무 적용 |
| 검색 단위 | 문서·청크·노드·경로 | 텍스트 청크(문장·단락) | 엔티티·관계·경로 | 도메인 데이터 구조 고려 |
| 검색 방식 | 의미 기반 컨텍스트 검색 | 임베딩 유사도(ANN, kNN) | 그래프 탐색(BFS, 경로 탐색, 질의 언어) | 복잡 질의 여부 판단 |
| 장점 | 외부 지식 결합으로 최신성 확보 | 대규모 텍스트, 구현 간단, 확장 쉬움 | 관계·원인·제약 표현, 근거 설명력 우수 | 규정·아키텍처·프로세스 도메인 적합 |
| 단점 | 파이프라인 설계 복잡 | 긴 체인 관계, 논리 구조 표현에 한계 | 그래프 모델링·유지 비용 높음 | 초기 모델링/운영 비용 고려 |
| 활용 | QA, 검색+생성, 요약·리라이팅 | FAQ, 기술문서 Q&A, 로그 분석, 코드 검색 | 정책·규격 해석, 아키텍처 분석, 원인·영향 분석 | 프로젝트 특성별 혼합 설계 |
- 도메인 구조화 수준과 질의 복잡도(단순 FAQ 및 규격·관계 추론)에 따라 Vector RAG 단독,Graph RAG,하이브리드 구조를 설계하는 것이 핵심
3. RAG, Vector RAG 및 Graph RAG 비교
| 구분 | RAG | Vector RAG | Graph RAG |
| 개념 | 검색(외부 지식) + 생성(LLM)을 결합한 전체 아키텍처 패턴 | 문서/청크를 임베딩 벡터로 만들어 유사도 기반으로 컨텍스트를 검색하는 RAG 구현 | 엔티티·관계를 그래프로 모델링하고 그래프 탐색으로 컨텍스트를 찾는 RAG 구현 |
| 데이터 구조 | 문서·텍스트·DB 등 다양한 외부 지식 소스 전체를 포괄 | 평면 텍스트 청크 + 임베딩 벡터 인덱스(FAISS, HNSW 등) | 노드(엔티티)·엣지(관계)로 구성된 지식그래프(KG, property graph 등) |
| 검색 방식 | “어떻게 검색할지”에 대해 특정 방식 제한 없음 | 질문 임베딩과의 코사인 유사도, 내적 등으로 상위 k개 청크 검색 | 그래프 질의 언어·경로 탐색(BFS, shortest path 등)로 관련 노드·경로·서브그래프 탐색 |
| 장점 | 외부 지식으로 최신성·정확성 향상, 다양한 소스 통합 가능 | 구현 단순, 대규모 텍스트에 적합, 스케일·성능 튜닝 용이 | 관계·경로·제약을 명시적으로 표현, 원인·영향 등 구조적 추론과 근거 설명에 강함 |
| 단점 | 파이프라인 설계·튜닝이 필요, 검색 품질에 따라 성능 편차 | 관계 구조 표현이 약해 복잡한 연쇄 추론·제약 조건 표현에 한계 | 그래프 모델링·지속적인 관리 비용 큼, 초기 구축 난이도 높음 |
| 적합한 질의 유형 | 일반 QA, FAQ, 검색+요약, 도메인 문서 기반 질의 전반 | “~이 무엇인가?”, “어떻게 하는가?” 등 유사 문서·설명 검색형 질의 | “무엇과 무엇의 관계?”, “원인/결과/영향은?”, “이 변경의 영향 범위는?” 등 관계 중심 질의 |
| 구축 난이도 | 개념적 프레임워크 수준, 세부 구현에 따라 천차만별 | 상대적으로 낮음(임베딩 모델 + 벡터DB 구축 중심) | 상대적으로 높음(지식 추출, 스키마 설계, 그래프 구축·정제 필요) |
| 운영·확장 | 검색 모듈 교체·추가, 캐시·로그 기반 품질 개선 등으로 점진적 고도화 가능 | 인덱스 증분 업데이트, 샤딩·복제 등으로 스케일 아웃 쉬움 | 그래프 크기 증가에 따른 성능·일관성 관리가 중요, 정기 정제·리빌딩 전략 필요 |
| 설명 가능성 | 근거 문서·청크 수준의 출처 제공 가능 | “어떤 문단에서 가져왔는지” 정도 근거 제공에 적합 | “어떤 엔티티가 어떤 관계를 통해 연결되었는지”까지 경로 기반 근거 설명 가능 |
| 활용 예시 | 사내 지식검색, 고객 상담, 매뉴얼 QA, 코드/로그 분석 등 | 기술 문서/표준 문서 FAQ, 로그 검색, 코드 검색, 일반 업무 지식검색 | 정책·규정 해석, 시스템 아키텍처 의존성, 변경 영향 분석, 규제·법규 관계 분석 등 |
4. 활용 및 기술 동향
- 사내 규정,표준 및 아키텍처 문서는 Vector RAG로 1차 검색, 핵심 엔티티·시스템 간 관계를 Graph로 모델링해 변경 영향 분석·원인 분석에 Graph RAG 적용하는 하이브리드 패턴이 실무에 적합
- 벡터,그래프,전통 키워드 검색을 통합한 멀티모달 RAG, 에이전트형 RAG(계획 및 도구 호출 포함), 스키마 자동 추출 기반 Graph RAG 자동화 등으로 발전 중이며, 대규모 도메인에서는 검색 정확도+근거 추적 요구로 Graph RAG 도입 검토가 확대되는 추세
<끝>
'인공지능(AI) 및 생성형 인공지능 > AI 주요 기술' 카테고리의 다른 글
| <문> 하이브리드 어텐션(Hybrid Attention) (0) | 2026.03.09 |
|---|---|
| <문> LLM, sLLM, SLM (0) | 2026.03.06 |
| <문> LLM 뇌 분할(Split-Brain) 문제 (1) | 2026.03.04 |
| <문> AI의 지속 학습(Continual Learning) 및 메타 학습(Meta-Learning) (0) | 2026.03.04 |
| <문> 장기 계획 강화학습 (Long-horizon RL) (0) | 2026.03.04 |