• Turing Post Korea
  • Posts
  • '12가지' RAG (Retrieval-Augmented Generation) μœ ν˜•

'12가지' RAG (Retrieval-Augmented Generation) μœ ν˜•

2020λ…„ 처음 λ“±μž₯ν•œ 이후, RAG (Retrieval-Augmented Generation)은 LLM μ–΄ν”Œλ¦¬μΌ€μ΄μ…˜μ„ λ§Œλ“œλŠ” μ—¬λŸ¬ 방법듀 쀑 μ£Όμš”ν•œ ν•˜λ‚˜λ‘œ μžλ¦¬μž‘μœΌλ©΄μ„œ 점점 더 큰 관심을 λ°›κ³  μžˆμŠ΅λ‹ˆλ‹€. RAG은 LLM μ–΄ν”Œλ¦¬μΌ€μ΄μ…˜μ΄ 더 μ •ν™•ν•œ, 그리고 더 λ§₯락에 λ§žλŠ” 닡변을 ν•  수 μžˆλ„λ‘ λ„μ™€μ£ΌλŠ” μ€‘μš”ν•œ λ°©λ²•μœΌλ‘œ, μˆœμ „νžˆ λͺ¨λΈμ— μ •λ³΄λœ 정보에 μ˜μ‘΄ν•˜μ§€ μ•Šκ³ , 닡변을 μƒμ„±ν•˜λŠ” κ³Όμ •μ—μ„œ μ μ ˆν•œ μ™ΈλΆ€ λ¬Έμ„œλ‚˜ 데이터λ₯Ό μ°Έμ‘°ν•˜λ„λ‘ ν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€. 이런 방식은, νŠΉμ •ν•˜κ³  μ •ν™•ν•œ 정보λ₯Ό μ œκ³΅ν•˜λŠ” 것이 μ€‘μš”ν•˜κ±°λ‚˜, μ•„λ‹ˆλ©΄ μ΅œμ‹ μ˜ 정보λ₯Ό 기반으둜 닡변을 μ£Όμ–΄μ•Ό ν•˜λŠ” κ²½μš°μ— 특히 μœ μš©ν•©λ‹ˆλ‹€.

μ•„λž˜, 각기 λ‹€λ₯Έ κ²½μš°μ— ν™œμš©ν•  수 μžˆλŠ” 12가지 μœ ν˜•μ˜ RAG을 μ •λ¦¬ν–ˆμŠ΅λ‹ˆλ‹€:

  1. μ˜€λ¦¬μ§€λ„ RAG λͺ¨λΈμ€ 사전 ν•™μŠ΅λœ μ–Έμ–΄ λͺ¨λΈ (λ§€κ°œλ³€μˆ˜ λ©”λͺ¨λ¦¬; Parametric Memory)을 μœ„ν‚€ν”Όλ””μ•„ 같은 λ¬Έμ„œλ₯Ό 고밀도 λ²‘ν„°λ‘œ μΈλ±μŠ€ν™”ν•œ μ™ΈλΆ€ 지식 μ†ŒμŠ€ (λΉ„ λ§€κ°œλ³€μˆ˜ λ©”λͺ¨λ¦¬; Non-parametric Memory)λ₯Ό κ²°ν•©ν•©λ‹ˆλ‹€. RAGλŠ” 생성 κ³Όμ •μ—μ„œ 이 μ†ŒμŠ€μ—μ„œ κ΄€λ ¨ 정보λ₯Ό κ²€μƒ‰ν•˜μ—¬ λͺ¨λΈμ˜ 정확도와 νŠΉμ΄λ„λ₯Ό ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€. β€”> [λ…Όλ¬Έ 보기]

  2. λ§ˆμ΄ν¬λ‘œμ†Œν”„νŠΈμ—μ„œ λ§Œλ“  Graph RAG은, 데이터λ₯Ό β€˜ν…μŠ€νŠΈ 데이터’와 κ·Έ β€˜μƒν˜Έ 관계’λ₯Ό λ‚˜νƒ€λ‚΄λŠ” κ·Έλž˜ν”„ ꡬ쑰둜 κ΅¬μ„±ν•©λ‹ˆλ‹€. Graph RAGλŠ” β€˜μΏΌλ¦¬β€™ μ€‘μ‹¬μ˜ μš”μ•½μ„ λŒ€κ·œλͺ¨λ‘œ μ²˜λ¦¬ν•˜κΈ° μœ„ν•΄ κ³ μ•ˆλœ RAG μ‹œμŠ€ν…œμž…λ‹ˆλ‹€. β€”> [λ…Όλ¬Έ 보기]

  3. LongRAGλŠ” 더 큰 ν…μŠ€νŠΈ λ‹¨μœ„(100단어 λŒ€μ‹  4,000토큰)λ₯Ό μ²˜λ¦¬ν•΄μ„œ, 검색해야 ν•˜λŠ” λ‹¨μœ„ 수λ₯Ό μ€„μ—¬μ£ΌλŠ” κ°œμ„ λœ λ²„μ „μ˜ RAG λͺ¨λΈμž…λ‹ˆλ‹€. "Long Retriever" 및 "Long Reader"λ₯Ό ν™œμš©ν•˜λŠ” 이 μ ‘κ·Ό 방식은 λ³„λ„μ˜ ν›ˆλ ¨ 없이도 큰 ν…μŠ€νŠΈμ—μ„œ 닡을 μΆ”μΆœν•˜λŠ” 정확도와 μ„±λŠ₯을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€. β€”> [λ…Όλ¬Έ 보기]

  4. Self-RAG (Self-Reflective approach)λ₯Ό μ‚¬μš©ν•˜λ©΄ λͺ¨λΈμ΄ ν•„μš”ν•  λ•Œλ§Œ 정보λ₯Ό κ²€μƒ‰ν•˜κ³  κ²€ν† ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 좔둠이라든가 팩트 체크가 ν•„μš”ν•œ μž‘μ—…μ—μ„œ ChatGPT 같은 λ‹€λ₯Έ λͺ¨λΈλ³΄λ‹€ λ›°μ–΄λ‚œ μ„±λŠ₯을 λ°œνœ˜ν•©λ‹ˆλ‹€. β€”> [λ…Όλ¬Έ 보기]

  5. Corrective RAG (CRAG)λŠ” μ™ΈλΆ€μ˜ β€˜κ²€μƒ‰ 평가기’λ₯Ό μ‚¬μš©ν•΄μ„œ κ²€μƒ‰λœ λ¬Έμ„œμ˜ ν’ˆμ§ˆμ„ κ°œμ„ ν•©λ‹ˆλ‹€. 핡심적인 정보에 더 μ§‘μ€‘ν•¨μœΌλ‘œμ¨ μƒμ„±λœ μ½˜ν…μΈ μ˜ μ •ν™•μ„± (Accuracy)κ³Ό 견고성 (Robustness)을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€. β€”> [λ…Όλ¬Έ 보기]

  6. EfficientRAGλŠ” λ©€ν‹°-홉 QA (MQA)의 각 λ‹¨κ³„μ—μ„œ LLM을 ν˜ΈμΆœν•˜λŠ” 것이 μ•„λ‹ˆλΌ, 단계λ₯Ό μ§€λ‚˜λ©΄μ„œ μƒˆ 쿼리λ₯Ό μƒμ„±ν•˜κ³  κ΄€λ ¨ μ—†λŠ” 정보λ₯Ό ν•„ν„°λ§ν•˜μ—¬ μ μ ˆν•œ 닡변을 효율적으둜 생성할 수 μžˆλ„λ‘ ν•΄ μ€λ‹ˆλ‹€. β€”> [λ…Όλ¬Έ 보기]

  7. Golden-RetrieverλŠ” β€˜Reflection-based Question Augmentationβ€™μ΄λΌλŠ” ν…Œν¬λ‹‰μ„ μ‚¬μš©ν•΄μ„œ μ‚°μ—…μ˜ Knowledge Baseμ—μ„œ λ„λ©”μΈμ˜ μ „λ¬Έ μš©μ–΄λ‚˜ λ¬Έλ§₯을 λ¨Όμ € μ²˜λ¦¬ν•˜κ³  κ°€μž₯ 관련성이 높은 λ¬Έμ„œλ₯Ό κ²€μƒ‰ν•˜λ„λ‘ λ„μ™€μ£ΌλŠ” RAG λͺ¨λΈμž…λ‹ˆλ‹€.
    β€”> [λ…Όλ¬Έ 보기]

  8. λŒ€ν™”ν˜• μ‹œμŠ€ν…œμ„ μœ„ν•œ Adaptive RAG은 항상 μ™ΈλΆ€ 지식을 κ²€μƒ‰ν•˜λŠ” 게 μ•„λ‹ˆλΌ, λŒ€ν™”μ˜ λ§₯락을 λ¨Όμ € μ‚΄νŽ΄ RAG이 ν•„μš”ν•œμ§€ 결정을 ν•©λ‹ˆλ‹€. 이 접근방법은 ν•„μš” μ‹œμ—λ§Œ RAGλ₯Ό μ‚¬μš©ν•˜λ―€λ‘œ λ‹΅λ³€μ˜ ν’ˆμ§ˆμ„ 높이고 더 μ •ν™•ν•œ, 확도 높은 닡을 ν•  수 μžˆλ„λ‘ ν•΄ μ€λ‹ˆλ‹€. β€”> [λ…Όλ¬Έ 보기]

  9. Modular RAGλŠ” λ³΅μž‘ν•œ RAG μ‹œμŠ€ν…œμ„ 독립적 λͺ¨λ“ˆκ³Ό μ „λ¬Έν™”λœ ꡬ성 μš”μ†Œλ‘œ λΆ„ν•΄ν•˜λŠ” κ³ κΈ‰ ν”„λ ˆμž„μ›μž…λ‹ˆλ‹€. κΈ°μ‘΄ RAGμ—μ„œ λ³΄λŠ” λ‹¨μˆœν•œ '검색 ν›„ 생성' ν”„λ‘œμ„ΈμŠ€μ™€λŠ” 달리, Modular RAGλŠ” λΌμš°νŒ…, μŠ€μΌ€μ€„λ§, ν”„λ‘œμ„ΈμŠ€ κ²°ν•©κ³Ό 같은 μœ μ—°ν•˜κ³  μ‚¬μš©μžκ°€ μ„€μ •ν•  수 μžˆλŠ” ꡬ쑰λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€. β€”> [λ…Όλ¬Έ 보기]

  10. Speculative RAG은 μ—¬λŸ¬ 개의 λ‹΅λ³€ μ΄ˆμ•ˆμ„ λ³‘λ ¬μ μœΌλ‘œ μƒμ„±ν•˜λŠ” μ†Œν˜•μ˜ β€˜μ „λ¬Έ μ–Έμ–΄λͺ¨λΈβ€™, 그리고 μ—¬λŸ¬ 가지 μ΄λŸ¬ν•œ μ΄ˆμ•ˆμ„ κ²€μ¦ν•˜μ—¬ 졜적의 닡을 μ°ΎλŠ” λŒ€ν˜•μ˜ β€˜μ’…ν•© μ–Έμ–΄λͺ¨λΈβ€™ 두 가지 μœ ν˜•μ˜ μ–Έμ–΄λͺ¨λΈμ„ κ²°ν•©ν•©λ‹ˆλ‹€. μ΄λ ‡κ²Œ ν•˜λ©΄ μ‹œμŠ€ν…œμ˜ νš¨μœ¨μ„±κ³Ό 속도λ₯Ό λͺ¨λ‘ ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€. β€”> [λ…Όλ¬Έ 보기]

  11. RankRAG은 κ΄€λ ¨λœ μ»¨ν…μŠ€νŠΈλ“€μ˜ μˆœμœ„λ₯Ό 맀기고 κ·Έ μˆœμœ„ 정보λ₯Ό μ§ˆλ¬Έμ— λ‹΅ν•˜λŠ” 데 μ‚¬μš©ν•˜λ„λ‘ λͺ¨λΈμ„ ν›ˆλ ¨μ‹œν‚€λŠ” ν”„λ ˆμž„μ›Œν¬μž…λ‹ˆλ‹€. 지식이 많이 ν•„μš”ν•œ μž‘μ—…μ— νƒμ›”ν•œ μ„±λŠ₯을 보일 수 μžˆμŠ΅λ‹ˆλ‹€. β€”> [λ…Όλ¬Έ 보기]

  12. Multi-Head RAG은 λͺ¨λΈμ˜ μ–΄ν…μ…˜ λ©”μ»€λ‹ˆμ¦˜μ—μ„œ μ„œλ‘œ λ‹€λ₯Έ 뢀뢄을 μ‚¬μš©ν•΄μ„œ 쿼리의 λ‹€μ–‘ν•œ 츑면을 ν¬μ°©ν•¨μœΌλ‘œμ¨ 관련성이 높은 정보λ₯Ό μ‰½κ²Œ μ°Ύκ³  μ‚¬μš©ν•  수 있게 ν•΄ μ€λ‹ˆλ‹€. 특히 λ³΅μž‘ν•œ 쿼리의 κ²½μš°μ— 검색 정확도λ₯Ό ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€. β€”> [λ…Όλ¬Έ 보기]

튜링 포슀트 μ½”λ¦¬μ•„μ—μ„œ μ»€λ²„ν•œ λ‹€λ₯Έ RAG κ΄€λ ¨ 글도 μ°Έκ³ ν•΄ λ³΄μ„Έμš”! πŸ˜ƒ βœŒοΈ 

μ½μ–΄μ£Όμ…”μ„œ κ°μ‚¬ν•©λ‹ˆλ‹€. 재미있게 보셨닀면 μΉœκ΅¬μ™€ λ™λ£Œ λΆ„λ“€μ—κ²Œλ„ λ‰΄μŠ€λ ˆν„°λ₯Ό μΆ”μ²œν•΄ μ£Όμ„Έμš”.

Reply

or to participate.