반응형 Deep Learning/Paper Review1 DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY 리뷰 review 본 논문은 2016년에 딥마인드에서 발표한 PER의 후속 논문으로 기존 PER과 대동소이하지만 제목에서 알 수 있듯이 데이터 분산처리라는 세팅에서 수행되었다는 점이 차이점입니다. 당시의 트렌드가 무거운 모델, 더 많은 데이터를 필요로 함에 따라 적절한 분산 처리를 통해 scalability를 확장하는 것이 중요한 과제였고 그에 따라 위와 같은 연구가 진행되었습니다. 목차 Gorila 에이전트는 learner, actor 및 매개 변수 서버를 분리하여 train process를 병렬화합니다. 단일 실험에서 여러 학습자 프로세스가 존재하며 지속적으로 파라미터 서버로 그래디언트를 보내고 업데이트된 파라미터를 수신합니다. 동시에, 독립된 actor는 병렬로 경험을 축적하고 매개변수 서버에서 Q-네트워크를 업데이.. 2021. 12. 21. 이전 1 다음 반응형