- Turing Post Korea
- Posts
- 강화학습에 대해 공부할 수 있는 무료 소스 5選
강화학습에 대해 공부할 수 있는 무료 소스 5選

강화학습(RL; Reinforcement Learning), 자율형 봇, 로봇 등 스스로 생각하고 움직이고, 문제를 해결하는 ‘차세대 AI’의 원동력이죠. 강화학습의 영역에서 새로운 것이 발견되고 발전하는 상황을 캐치업하는 것도 쉬운 일이 아닌데요. 이와 관련한 몇 가지 새로운 자료를 여러분과 공유합니다:
"Reinforcement Learning from Human Feedback" by Nathan Lambert
RLHF(Reinforcement Learning from Human Feedback)에 대한 간략한 소개를 하고, Instruction Tuning (명령어 튜닝), 보상 모델링, Alignment 기법, 합성 데이터, 평가 등의 요소들에 대해서 설명합니다."A Course in Reinforcement Learning (2nd Edition)" by Dimitri P. Bertsekas
다이나믹 프로그래밍(DP)과 강화학습(RL)을 설명하는데, 롤아웃 알고리즘, 신경망, 정책 학습 등에 대해서 특히 깊이있게 다룹니다. 연습 문제 (풀이 포함)와 실제 사례들이 많이 들어 있습니다."Mathematical Foundations of Reinforcement Learning" video course by Shiyu Zhao
강화학습에 대해서 수학적인 내용을 포함하지만 비교적 친근하게 접근할 수 있도록 소개합니다. Bellman Equation, Monte Carlo 학습, Approximation (근사), 정책 그래디언트 (Policy Gradient), Actor-Critic 기법 등에 대해서 다룹니다."Multi-Agent Reinforcement Learning" by Stefano V. Albrecht, Filippos Christianos, and Lukas Schäfer
모델, 그리고 멀티 에이전트 강화학습 (MARL)의 핵심 아이디어 및 딥러닝과 결합하는 현대적인 접근 방식을 다룹니다."Reinforcement Learning: A Comprehensive Overview" by Kevin P. Murphy
강화학습, 그리고 순차적 의사결정 문제에 대해서 설명하고, 여러 가지 강화학습 기법 (가치 기반, 정책 그래디언트, 모델 기반, 멀티 에이전트 강화학습 기법, RL+LLM, RL+추론 등)에 대해서 다룹니다.
*읽어주셔서 감사합니다. 재미있게 보셨다면 친구와 동료 분들에게도 뉴스레터를 추천해 주세요.
Reply