-
유튜브 팡요랩 1~10강 // 현재 10강 수강중. 1회독 끗.
1강 | Introduction to RL
2강 | Markov Decision Process
3강 | Planning by Dynamic Programming
4강 | Model-Free Prediction
5강 | Model Free Control
6강 | Value Function Approximation
7강 | Policy Gradient
8강 | Integrating Learning and Planning
9강 | Exploration and Exploitation
10강 | Classic Games
-
openai spinning up
[Spinning Up as a Deep RL Researcher](https://serotina.notion.site/Spinning-Up-as-a-Deep-RL-Researcher-dc9597fc07a8471b9e5a6fe5ef3c4f34)
[OpenAI Spinning Up 번역] Part 1: 강화학습 핵심 개념(Key Concepts in RL)](https://mclearninglab.tistory.com/53)
-
바닥부터 배우는 강화학습
- 1회독 끗
-
SungKim RL
- 4?
-
Unity ML-agent로 배우는 강화학습
- 0.5
-
huggingface-RL course
Hugging-face-RL Course
-
Udacity
-
K-mooc 정태수
-
Udemy
- 40% ??
- 50% But Experimental Parts 2 is not exactly working
-
수학으로 풀어보는 강화학습 원리와 알고리즘
- 1일차 - 1.4 가우시안 분포 전까지 학습 완료
- 2일차 - 1.12 벡터와 행렬의 미분 전까지 학습 완료
- 3일차 - 2 강화학습 개념 전까지 학습 완료
- 4일차 - 3 정책 그래디언트 전까지 학습 완료 ( 103p )
- 5일차 - 3 정책 그리디언트 학습 완료 ( 114p )
- 6,7일차 - 4 A2C ( 122p )
- 8일차 - 4 A2C (143p 코드 실행 전 )
- 9일차 - 4 A2C (152p 코드 실행 후 )
- 10일차 - 5 A3C (204p 코드 실행 후 )
- 11일차 - 6 PPO (218p 슈도 코드 학습 전 )
- 12일차 - 6 PPO ( 223p 코드 실행전 )
- 13일차 - 7 DDPG ( 251p 7.3 알고리즘 학습전 )
-
고려대 오승상 강화학습
01 | DRL Introduction
02 | Markov property
03 | Markov Decision Process
04 | Reward and Policy
05 | Bellman Equation
-
Stable-Baselines-Full-Tutorial
- getting_started.ipynb
- gym_wrappers_saving_loading
-
(*)단단한 강화학습 영어 원서도 추천
-
(*)CS234: Reinforcement Learning Winter 2022
-
UCL Course on RL
-
Deep Reinforcement Learning: CS 285 Fall 2021 (UC Berkeley)
-
파이썬과 케라스로 배우는 강화학습