강화학습

손으로 쓰는 강화학습(Reinforcement Learning) - (5) Monte-Carlo 최적 정책, GLIE, e-greedy policy

H_erb Salt 2020. 9. 7. 14:37