12/31 세미나했던것. 영어로 작성했던 ppt라 영어로 포스팅ㄷㄷ
핵심은 exploration을 좀 더 잘하기위해 intrinsic reward를 어떻게 줄것인지에 초점. 그냥 multi agent들로 막 exploration해서만은 이 경지에 이르지 못한다고 함. 결국 실험(pitfall environment)이 잘되서 논문으로 나온듯..?
12/31 세미나했던것. 영어로 작성했던 ppt라 영어로 포스팅ㄷㄷ
핵심은 exploration을 좀 더 잘하기위해 intrinsic reward를 어떻게 줄것인지에 초점. 그냥 multi agent들로 막 exploration해서만은 이 경지에 이르지 못한다고 함. 결국 실험(pitfall environment)이 잘되서 논문으로 나온듯..?