Model-Free Prediction

Environment를 모를때 Model-Free Prediction을 풀거고 MC , TD로 풀 수 있다.

Unknown MDP에 대해서 Value Function을 찾는다.

Monte-Carlo Reinforcement Learning

Monte-Carlo Policy Evaluation ( Prediction )

First-Visit MC Policy Evaluation