강화학습

손으로 쓰는 강화학습(Reinforcement Learning) - (4) Monte-Carlo, Temporal-Difference

H_erb Salt 2020. 9. 7. 14:20

Model free 방법론에서의 MC / TD method.