데분데싸
홈
gradient
1
손으로 쓰는 강화학습(Reinforcement Learning) - (6) 정책경사(Gradient Policy, REINFORCE 알고리즘)
강화학습
2020.10.08
1
더보기
티스토리툴바
데분데싸
구독하기