데분데싸
홈
강화학습
손으로 쓰는 강화학습(Reinforcement Learning) - (6) 정책경사(Gradient Policy, REINFORCE 알고리즘)
H_erb Salt
2020. 10. 8. 14:00
공유하기
URL 복사
카카오톡 공유
페이스북 공유
엑스 공유
게시글 관리
구독하기
데분데싸
'
강화학습
' 카테고리의 다른 글
MC(Monte Carlo)/TD(temporal difference) Control 구현
(0)
2023.01.19
MC(Monte Carlo)/TD(temporal difference) Prediction 구현
(0)
2023.01.19
손으로 쓰는 강화학습(Reinforcement Learning) - (5) Monte-Carlo 최적 정책, GLIE, e-greedy policy
(0)
2020.09.07
손으로 쓰는 강화학습(Reinforcement Learning) - (4) Monte-Carlo, Temporal-Difference
(0)
2020.09.07
손으로 쓰는 강화학습(Reinforcement Learning) - (3) DP(Dynamic Programming)
(0)
2020.08.31
티스토리툴바
데분데싸
구독하기
관리메뉴열기
개인정보
티스토리 홈
포럼
로그인
닫기
단축키
내 블로그
내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W
블로그 게시글
글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C
모든 영역
이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift
+
/
⇧
+
/
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.