공부/강화학습(RL: Reinforcement Learning) (1) 썸네일형 리스트형 강화학습 개요 / 스키너의 쥐 실험과 강화학습의 과업 예시 강화학습이란? 강화학습(Reinforcement Learning)은 에이전트가 환경과 상호작용하면서 스스로 학습하는 방식을 말합니다. 즉, 상태의 변화와 행동을 번갈아 수행하면서 목적을 달성하게 됩니다. 이는 다음 그림과 같이 표현할 수 있습니다. 위 그림의 순서는 다음과 같이 진행됩니다. 1) 에이전트는 현재 상태에서 어떠한 행동을 취하게 됩니다. 2) 그럼 환경은 행동에 따른 다음 상태와 보상을 에이전트에게 전달합니다. 3) 에이전트는 환경으로부터 받은 보상에 따라 다음 행동을 취하게 됩니다. 4) 위 과정을 반복하면서 에이전트는 최대의 보상을 얻는 행동을 계속해서 하게 됩니다. 스키너의 쥐 실험 미국의 심리학자인 B. F. 스키너(버러스 프레더릭 스키너)는 스키너 상자라는 동물 행동을 연구하는데 사.. 이전 1 다음