IT/Paper

[RL] Never Give Up: Learning Directed Exploration Strategies, ICML 2020

성진팍 2021. 3. 4. 15:06

12/31 세미나했던것. 영어로 작성했던 ppt라 영어로 포스팅ㄷㄷ

핵심은 exploration을 좀 더 잘하기위해 intrinsic reward를 어떻게 줄것인지에 초점. 그냥 multi agent들로 막 exploration해서만은 이 경지에 이르지 못한다고 함. 결국 실험(pitfall environment)이 잘되서 논문으로 나온듯..? 

 

 

 

 

 

 

 

 

spare reward 환경에서는 잘나와야 했을것이고

 

dense reward는 더 비효율적인 것이 많았던 듯.