강화학습
손으로 쓰는 강화학습(Reinforcement Learning) - (4) Monte-Carlo, Temporal-Difference
H_erb Salt
2020. 9. 7. 14:20
Model free 방법론에서의 MC / TD method.