더 정확하면서도 잘 적응하는 '계획'을 세우게 하는 법 + 강화학습 기반의 DeepSeek 추론 훈련
SLM에서 '데이터셋 품질'과 '적절한 훈련 전략'의 중요성
'추론 (Reasoning)'한다는 건 구체적으로 뭘까요? ‘생각의 모드'에 대해 논의해 봅시다.
벤치마크의 포화, 굿하트의 법칙과 진짜 '지능'을 측정하기 위한 방향 + Sesame AI + 금주의 주요 뉴스 및 연구
Mamba가 멀티모달 데이터를 잘 처리하도록 해 주는 새로운 기법
현실로 들어오고 있는 최신의 AI 기술들 + 금주의 주요 뉴스 및 연구
Long Context 및 멀티홉 (Multi-hop) 추론을 위해서 구글, 마이크로소프트가 고안한 또 다른 'Chain' 기법
+ 금주의 주요 뉴스 및 연구