- Turing Post Korea
- Posts
- '12κ°μ§' RAG (Retrieval-Augmented Generation) μ ν
'12κ°μ§' RAG (Retrieval-Augmented Generation) μ ν

2020λ μ²μ λ±μ₯ν μ΄ν, RAG (Retrieval-Augmented Generation)μ LLM μ΄ν리μΌμ΄μ μ λ§λλ μ¬λ¬ λ°©λ²λ€ μ€ μ£Όμν νλλ‘ μ리μ‘μΌλ©΄μ μ μ λ ν° κ΄μ¬μ λ°κ³ μμ΅λλ€. RAGμ LLM μ΄ν리μΌμ΄μ μ΄ λ μ νν, κ·Έλ¦¬κ³ λ λ§₯λ½μ λ§λ λ΅λ³μ ν μ μλλ‘ λμμ£Όλ μ€μν λ°©λ²μΌλ‘, μμ ν λͺ¨λΈμ μ 보λ μ 보μ μμ‘΄νμ§ μκ³ , λ΅λ³μ μμ±νλ κ³Όμ μμ μ μ ν μΈλΆ λ¬Έμλ λ°μ΄ν°λ₯Ό μ°Έμ‘°νλλ‘ νκΈ° λλ¬Έμ λλ€. μ΄λ° λ°©μμ, νΉμ νκ³ μ νν μ 보λ₯Ό μ 곡νλ κ²μ΄ μ€μνκ±°λ, μλλ©΄ μ΅μ μ μ 보λ₯Ό κΈ°λ°μΌλ‘ λ΅λ³μ μ£Όμ΄μΌ νλ κ²½μ°μ νΉν μ μ©ν©λλ€.
μλ, κ°κΈ° λ€λ₯Έ κ²½μ°μ νμ©ν μ μλ 12κ°μ§ μ νμ RAGμ μ 리νμ΅λλ€:
μ€λ¦¬μ§λ RAG λͺ¨λΈμ μ¬μ νμ΅λ μΈμ΄ λͺ¨λΈ (맀κ°λ³μ λ©λͺ¨λ¦¬; Parametric Memory)μ μν€νΌλμ κ°μ λ¬Έμλ₯Ό κ³ λ°λ 벑ν°λ‘ μΈλ±μ€νν μΈλΆ μ§μ μμ€ (λΉ λ§€κ°λ³μ λ©λͺ¨λ¦¬; Non-parametric Memory)λ₯Ό κ²°ν©ν©λλ€. RAGλ μμ± κ³Όμ μμ μ΄ μμ€μμ κ΄λ ¨ μ 보λ₯Ό κ²μνμ¬ λͺ¨λΈμ μ νλμ νΉμ΄λλ₯Ό ν₯μμν΅λλ€. β> [λ Όλ¬Έ 보기]
λ§μ΄ν¬λ‘μννΈμμ λ§λ Graph RAGμ, λ°μ΄ν°λ₯Ό βν μ€νΈ λ°μ΄ν°βμ κ·Έ βμνΈ κ΄κ³βλ₯Ό λνλ΄λ κ·Έλν κ΅¬μ‘°λ‘ κ΅¬μ±ν©λλ€. Graph RAGλ β쿼리β μ€μ¬μ μμ½μ λκ·λͺ¨λ‘ μ²λ¦¬νκΈ° μν΄ κ³ μλ RAG μμ€ν μ λλ€. β> [λ Όλ¬Έ 보기]
LongRAGλ λ ν° ν μ€νΈ λ¨μ(100λ¨μ΄ λμ 4,000ν ν°)λ₯Ό μ²λ¦¬ν΄μ, κ²μν΄μΌ νλ λ¨μ μλ₯Ό μ€μ¬μ£Όλ κ°μ λ λ²μ μ RAG λͺ¨λΈμ λλ€. "Long Retriever" λ° "Long Reader"λ₯Ό νμ©νλ μ΄ μ κ·Ό λ°©μμ λ³λμ νλ ¨ μμ΄λ ν° ν μ€νΈμμ λ΅μ μΆμΆνλ μ νλμ μ±λ₯μ ν₯μμν΅λλ€. β> [λ Όλ¬Έ 보기]
Self-RAG (Self-Reflective approach)λ₯Ό μ¬μ©νλ©΄ λͺ¨λΈμ΄ νμν λλ§ μ 보λ₯Ό κ²μνκ³ κ²ν ν μ μμ΅λλ€. μΆλ‘ μ΄λΌλ κ° ν©νΈ 체ν¬κ° νμν μμ μμ ChatGPT κ°μ λ€λ₯Έ λͺ¨λΈλ³΄λ€ λ°μ΄λ μ±λ₯μ λ°νν©λλ€. β> [λ Όλ¬Έ 보기]
Corrective RAG (CRAG)λ μΈλΆμ βκ²μ νκ°κΈ°βλ₯Ό μ¬μ©ν΄μ κ²μλ λ¬Έμμ νμ§μ κ°μ ν©λλ€. ν΅μ¬μ μΈ μ 보μ λ μ§μ€ν¨μΌλ‘μ¨ μμ±λ μ½ν μΈ μ μ νμ± (Accuracy)κ³Ό κ²¬κ³ μ± (Robustness)μ ν₯μμν΅λλ€. β> [λ Όλ¬Έ 보기]
EfficientRAGλ λ©ν°-ν QA (MQA)μ κ° λ¨κ³μμ LLMμ νΈμΆνλ κ²μ΄ μλλΌ, λ¨κ³λ₯Ό μ§λλ©΄μ μ 쿼리λ₯Ό μμ±νκ³ κ΄λ ¨ μλ μ 보λ₯Ό νν°λ§νμ¬ μ μ ν λ΅λ³μ ν¨μ¨μ μΌλ‘ μμ±ν μ μλλ‘ ν΄ μ€λλ€. β> [λ Όλ¬Έ 보기]
Golden-Retrieverλ βReflection-based Question Augmentationβμ΄λΌλ ν ν¬λμ μ¬μ©ν΄μ μ°μ μ Knowledge Baseμμ λλ©μΈμ μ λ¬Έ μ©μ΄λ λ¬Έλ§₯μ λ¨Όμ μ²λ¦¬νκ³ κ°μ₯ κ΄λ ¨μ±μ΄ λμ λ¬Έμλ₯Ό κ²μνλλ‘ λμμ£Όλ RAG λͺ¨λΈμ λλ€.
β> [λ Όλ¬Έ 보기]λνν μμ€ν μ μν Adaptive RAGμ νμ μΈλΆ μ§μμ κ²μνλ κ² μλλΌ, λνμ λ§₯λ½μ λ¨Όμ μ΄ν΄ RAGμ΄ νμνμ§ κ²°μ μ ν©λλ€. μ΄ μ κ·Όλ°©λ²μ νμ μμλ§ RAGλ₯Ό μ¬μ©νλ―λ‘ λ΅λ³μ νμ§μ λμ΄κ³ λ μ νν, νλ λμ λ΅μ ν μ μλλ‘ ν΄ μ€λλ€. β> [λ Όλ¬Έ 보기]
Modular RAGλ 볡μ‘ν RAG μμ€ν μ λ 립μ λͺ¨λκ³Ό μ λ¬Ένλ κ΅¬μ± μμλ‘ λΆν΄νλ κ³ κΈ νλ μμμ λλ€. κΈ°μ‘΄ RAGμμ 보λ λ¨μν 'κ²μ ν μμ±' νλ‘μΈμ€μλ λ¬λ¦¬, Modular RAGλ λΌμ°ν , μ€μΌμ€λ§, νλ‘μΈμ€ κ²°ν©κ³Ό κ°μ μ μ°νκ³ μ¬μ©μκ° μ€μ ν μ μλ ꡬ쑰λ₯Ό μ 곡ν©λλ€. β> [λ Όλ¬Έ 보기]
Speculative RAGμ μ¬λ¬ κ°μ λ΅λ³ μ΄μμ λ³λ ¬μ μΌλ‘ μμ±νλ μνμ βμ λ¬Έ μΈμ΄λͺ¨λΈβ, κ·Έλ¦¬κ³ μ¬λ¬ κ°μ§ μ΄λ¬ν μ΄μμ κ²μ¦νμ¬ μ΅μ μ λ΅μ μ°Ύλ λνμ βμ’ ν© μΈμ΄λͺ¨λΈβ λ κ°μ§ μ νμ μΈμ΄λͺ¨λΈμ κ²°ν©ν©λλ€. μ΄λ κ² νλ©΄ μμ€ν μ ν¨μ¨μ±κ³Ό μλλ₯Ό λͺ¨λ ν₯μμν¬ μ μμ΅λλ€. β> [λ Όλ¬Έ 보기]
RankRAGμ κ΄λ ¨λ 컨ν μ€νΈλ€μ μμλ₯Ό λ§€κΈ°κ³ κ·Έ μμ μ 보λ₯Ό μ§λ¬Έμ λ΅νλ λ° μ¬μ©νλλ‘ λͺ¨λΈμ νλ ¨μν€λ νλ μμν¬μ λλ€. μ§μμ΄ λ§μ΄ νμν μμ μ νμν μ±λ₯μ λ³΄μΌ μ μμ΅λλ€. β> [λ Όλ¬Έ 보기]
Multi-Head RAGμ λͺ¨λΈμ μ΄ν μ λ©μ»€λμ¦μμ μλ‘ λ€λ₯Έ λΆλΆμ μ¬μ©ν΄μ 쿼리μ λ€μν μΈ‘λ©΄μ ν¬μ°©ν¨μΌλ‘μ¨ κ΄λ ¨μ±μ΄ λμ μ 보λ₯Ό μ½κ² μ°Ύκ³ μ¬μ©ν μ μκ² ν΄ μ€λλ€. νΉν 볡μ‘ν 쿼리μ κ²½μ°μ κ²μ μ νλλ₯Ό ν₯μμν¬ μ μμ΅λλ€. β> [λ Όλ¬Έ 보기]
νλ§ ν¬μ€νΈ μ½λ¦¬μμμ 컀λ²ν λ€λ₯Έ RAG κ΄λ ¨ κΈλ μ°Έκ³ ν΄ λ³΄μΈμ! π βοΈ
μ½μ΄μ£Όμ μ κ°μ¬ν©λλ€. μ¬λ―Έμκ² λ³΄μ ¨λ€λ©΄ μΉκ΅¬μ λλ£ λΆλ€μκ²λ λ΄μ€λ ν°λ₯Ό μΆμ²ν΄ μ£ΌμΈμ.
Reply