SlideShare verwendet Cookies, um die Funktionalität und Leistungsfähigkeit der Webseite zu verbessern und Ihnen relevante Werbung bereitzustellen. Wenn Sie diese Webseite weiter besuchen, erklären Sie sich mit der Verwendung von Cookies auf dieser Seite einverstanden. Lesen Sie bitte unsere Nutzervereinbarung und die Datenschutzrichtlinie.
SlideShare verwendet Cookies, um die Funktionalität und Leistungsfähigkeit der Webseite zu verbessern und Ihnen relevante Werbung bereitzustellen. Wenn Sie diese Webseite weiter besuchen, erklären Sie sich mit der Verwendung von Cookies auf dieser Seite einverstanden. Lesen Sie bitte unsere unsere Datenschutzrichtlinie und die Nutzervereinbarung.
Veröffentlicht am
ICLR2019に投稿されたR2D2 (Recurrent Replay Distributed DQN)アルゴリズムの紹介。
深層強化学習の分散化の流れ(A3C/Ape-X/IMPALA)やRNN活用(DRQN)についても合わせて概観しています。
※ 分かりにくい箇所や、不正確な記載があればコメントいただけると嬉しいです。
Sie haben diese Folie bereits ins Clipboard „“ geclippt.
Loggen Sie sich ein, um Kommentare anzuzeigen.