Reinforcement Learning(RL) (1) 썸네일형 리스트형 [강화 학습] 마르코프 결정 과정(Markov Decision Process) ※ 이번 포스팅에서는 강화 학습의 기본 개념인 마르코프 결정 과정에 대해 알아보자.강화 학습이란?강화 학습의 5요소마르코프 결정 과정강화 학습(Reinforcement Learning)이란? 강화 학습은 에이전트(Agent)가 환경(Environment)과 상호작용하면서 최적의 행동(Policy)을 학습하는 기계 학습 방법이다. 쉽게 설명하자면 마치 인간처럼 시행 착오를 통해 보상을 최대화하는 행동을 학습하는 과정이라고 말할 수 있다. 게임을 한다고 하면 최고 보상을 얻는 과정을 학습하는 것이다.강화 학습의 5요소 강화 학습을 구성하는 요소는 에이전트, 환경, 상태, 행동, 보상이 있다. 각 요소에 대해 좀 더 자세히 알아보자. 에이전트(Agent) 강화 학습에서 학습을 수행하는 주체로 학습하는 모델을 .. 이전 1 다음