- Turing Post Korea
- Posts
- 새로운 RAG 기법 16選
새로운 RAG 기법 16選
튜링 포스트 코리아에서 2024년 8월에 ‘12가지 RAG 유형’이라는 이름으로 ‘Twitter Library’ 포스팅을 한 적이 있는데요:
4개월 남짓한 그 사이에 (!) 새롭고 향상된 많은 RAG 기법들이 또 등장했습니다…
LLM의 응답을 생성하는 과정에서, 외부 문서나 데이터를 검색해서 응답의 정확도를 향상시켜주는 RAG은, 특히 구체적인, 최신이 지식이 필요한 작업을 할 때 유용한데요. 이미 LLM을 활용하는 어플리케이션을 만들 때의 표준 아키텍처 중 하나로 자리잡은 듯 합니다. 특히 기업용 어플리케이션이라면요.
아래에서 최신의 RAG 기법 16가지를 소개합니다:
HtmlRAG는 일반 텍스트 대신 제목이나 표와 같은 중요한 정보 구조를 유지하기 위해서 HTML을 직접 사용하는 방식을 제안하는데요. HTML에 따라오는 추가적인 노이즈와 그 크기를 처리하기 위해서 ‘정제 (Cleaning)’과 ‘가지치기 (Pruning)’ 기법을 활용합니다. —> [더 보기]
FastRAG은 스키마와 스크립트 학습을 이용해서 AI 모델에 전적으로 의존하지 않고도 데이터를 효율적으로 처리합니다. 텍스트 검색과 지식 그래프 (Knowledge Graph) 질의를 결합해서 정확도를 높이고, 처리 시간을 90%, 비용을 85% 절감해 준다고 합니다. —> [더 보기]
Auto-RAG은 LLM을 사용해서 충분한 정보가 수집될 때까지 멀티턴 대화를 실행, 쿼리를 개선하고 검색을 계획하는 자율적인 (Autonomous) 접근 방식을 취합니다. 이 방식은 질문의 난이도에 맞춰 적응을 하고 자연어로 그 과정을 설명해 주기도 한다네요. —> [더 보기]
CORAG은 MCTS (몬테카를로 트리 검색) 프레임웍을 기반으로 문서 청크 (Document Chunk)들 간의 상관관계를 고려하고, 더 많은 청크를 추가하면 얼마나 도움이 될지 등을 검토, 판단합니다. 그리고 ‘설정 에이전트’라는 걸 가지고 다양한 질의 유형에 맞춰 대응한다고 합니다. —> [더 보기]
MemoRAG은 ‘장기 메모리’를 갖춘 이중 시스템 - 이중 LLM - 접근 방식을 소개합니다. 경량 LLM이 데이터베이스의 ‘전역 메모리’를 만들고 검색 도구를 가이드할 초안 답변을 생성하고, 더 강력한 LLM이 검색된 데이터를 사용해서 최종 답변을 생성합니다. —> [더 보기]
RAG-Thief는 LLM과 ‘프라이빗’한 지식 베이스를 통합하게 되는 RAG 시스템이 개인정보 보호 관점에서 위험이 있다는 점을 노출시키도록 설계되었는데요. 적대적 쿼리로 시작해서 거기에 대한 응답으로부터 학습해 나가면서, 더 효과적인 쿼리를 생성하는 자동화된 접근 방식을 사용해서 프리이빗 데이터의 70% 이상을 추출합니다 (!). —> [더 보기]
AssistRAG는 도구, 메모리, 계획을 관리하기 위해서 LLM 내에 지능형 어시스턴트를 통합한 모습인데요. 정보를 더 잘 검색하고 의사결정을 더 잘 하도록, ‘Curriculum Assistant Learning’, ‘Reinforcement Preference Optimization’의 2단계 학습 과정을 적용한다고 합니다. —> [더 보기]
LaB-RAG는, 이미지 레이블을 RAG 및 LLM과 결합해서 이미지 캡션을 생성해 줍니다. 간단한 분류기를 사용해서 X-레이 이미지를 텍스트 레이블로 변환하고, 이 레이블들은 LLM을 학습시키거나 이미지 데이터를 직접 사용하지 않고도 사전 학습된 LLM이 상세한 방사선 보고서를 생성하도록 가이드하는 구조입니다. —> [더 보기]
Video-RAG는 광범위한 파인튜닝을 하지 않고도 모델이 긴 동영상을 더 잘 이해하도록 도와주는, 경량의, 비용 효율적인 솔루션입니다. 플러그-앤-플레이 방식으로 오픈소스 도구들을 활용해서 동영상에서 정렬된 정보를 추출하고, 이 데이터를 ‘보조적인 텍스트’로서 LVLM과 통합합니다. —> [더 보기]
Retrieval-Augmented Forecasting (RAF)은 Chronos 같은 시계열 기반 모델(TSFM; Time-Series Foundation Models)을 개선하는데, 예측치 개선을 위해서 관련된 시계열 예시를 다이나믹하게 검색합니다. 이렇게 해서 시계열 데이터의 이벤트 기반 특성, 그리고 진화하는 특성을 다룰 수 있다고 하네요. —> [더 보기]
RuAG는 LLM의 상식 (Commonsense)을 활용해서 술어 (Predicates)를 정의하고, MCTS (몬테카를로 트리 검색)로 데이터를 효율적으로 탐색해서, 대규모 데이터셋을 해석 가능한 논리 규칙으로 변환해 줍니다. 그 다음에 이 논리 규칙들을 자연어로 변환해서 LLM 프롬프트에 통합해서, 추론 능력을 향상시켜 준다고 합니다. —> [더 보기]
MMed-RAG는 진단이라든가 보고서 생성 같은 작업에서 의료 영역의 VLM (시각-언어 모델)의 Factual Accuracy (사실적 정확도)를 개선하도록 설계된 멀티모달 RAG 시스템입니다. 적응형 컨텍스트 선택, 선호도 기반의 파인튜닝 (Preference Fine-Tuning) 기법을 사용해서 환각 (Hallucination), Misalignment 같은 문제들을 해결해 줍니다. —> [더 보기]
Path-RAG은 PathVQA-Open 작업에서 필요한 병리 이미지 분석 작업을 개선, 암 진단을 더 잘 하도록 해 주는 특별한 프레임웍입니다. HistoCartography를 사용해서 이미지에서 지식을 추출하고, 전문가의 인사이트를 통합할 핵심 패치들을 선택해서, 정확도를 38%에서 47%로 높이고 긴 형식의 질의 응답을 개선해 줍니다. —> [더 보기]
Multi-Reranker는 금융 관련 작업으로 만들어진 시스템인데, 검색의 정확도를 높이기 위해서 여러 가지 Reranker 모델을 사용합니다. 쿼리 확장 최적화 (Optimized Query Expansion), 말뭉치 개선 (Corpus Refinement), 검색 알고리즘 개선 등을 통해서 재무제표나 공시 분석 같은 복잡한 금융 관련 작업을 할 수 있게 해 주는 이 기법은, ACM-ICAIF '24 FinanceRAG 대회에서 2위를 차지했네요. —> [더 보기]
G-RAG은 재료 과학 등의 분야에서 정보 검색을 더 잘 하도록 설계됐습니다. 문서에서 추출한 주요 개체(MatID) 간의 관계를 매핑하는 그래프 데이터베이스를 사용해서, 위키피디아 같은 외부 지식 베이스에서 관련 정보를 검색할 수 있도록 가이드합니다. —> [더 보기]
RAGDiffusion은 실제 데이터로부터 정확한 평면의 ‘의류 이미지’를 생성하기 위한 RAG 프레임웍으로, 구조적인 오류, 환각 현상 등을 해결하는데 도움이 된다고 합니다. 공간적인 랜드마크 안내를 위한 검색의 기반 구조 집계 기법, 그리고 구조, 패턴, 세부 사항을 정렬할 수 있도록 하는 의류 이미지 생성 기법입니다. —> [더 보기]
*읽어주셔서 감사합니다. 재미있게 보셨다면 친구와 동료 분들에게도 뉴스레터를 추천해 주세요.
Reply