데분데싸

  • 홈

Monte-Carlo 2

손으로 쓰는 강화학습(Reinforcement Learning) - (5) Monte-Carlo 최적 정책, GLIE, e-greedy policy

강화학습 2020.09.07

손으로 쓰는 강화학습(Reinforcement Learning) - (4) Monte-Carlo, Temporal-Difference

Model free 방법론에서의 MC / TD method.

강화학습 2020.09.07
1
더보기
프로필사진

  • 분류 전체보기 (67)
    • 기계학습 (30)
      • 인공지능및기계학습개론정리 (9)
      • 밑바닥딥러닝3 오독오독 씹기 (8)
      • 베이지안 (5)
      • 수리통계학 (3)
    • 강화학습 (8)
    • 자연어, 비전 (6)
    • 교육자료 (3)
    • 논문 (1)
    • 빅데이터분석기사정리 (2)
    • 끄적끄적 (16)

최근글과 인기글

  • 최근글
  • 인기글

Tag

pymc3, 강화학습, reinforcement, Modeling, 몬테카를로, 앙상블, 베이지안, forward, Bayesian, 역전파, Monte-Carlo, 자연어, NLP, HMM, MCMC, 분석기사, 빅데이터, 머신러닝, 밑바닥부터시작하는딥러닝3, 빅데이터 분석기사,

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바