[RL] Never Give Up: Learning Directed Exploration Strategies, ICML 2020 12/31 세미나했던것. 영어로 작성했던 ppt라 영어로 포스팅ㄷㄷ 핵심은 exploration을 좀 더 잘하기위해 intrinsic reward를 어떻게 줄것인지에 초점. 그냥 multi agent들로 막 exploration해서만은 이 경지에 이르지 못한다고 함. 결국 실험(pitfall environment)이 잘되서 논문으로 나온듯..? IT/Paper 2021.03.04