더 정확하면서도 잘 적응하는 '계획'을 세우게 하는 법 + 강화학습 기반의 DeepSeek 추론 훈련
SLM에서 '데이터셋 품질'과 '적절한 훈련 전략'의 중요성
'추론 (Reasoning)'한다는 건 구체적으로 뭘까요? ‘생각의 모드'에 대해 논의해 봅시다.