LAPO: Latent-Variable Advantage-Weighted Policy Optimization for Offline Reinforcement Learning

Item #:

068431-2674

Details

DOI: https://doi.org/10.52202/068431-2674
Author(s): Xi Chen, Ali Ghadirzadeh, Tianhe Yu, Jianhao Wang, Alex Yuan Gao, Wenzhe Li, Liang Bin, Chelsea Finn, Chongjie Zhang
Pages: 36902-36913 (12 pages)
Format: PDF Paper Download
Conference: Advances in Neural Information Processing Systems 35
Date/Location: Held 28 November - 9 December 2022, New Orleans, Louisiana, USA.
Series: Advances in Neural Information Processing Systems 35
Publisher: Neural Information Processing Systems Foundation, Inc. (NeurIPS)

DOI: https://doi.org/10.52202/068431-2674
Author(s): Xi Chen, Ali Ghadirzadeh, Tianhe Yu, Jianhao Wang, Alex Yuan Gao, Wenzhe Li, Liang Bin, Chelsea Finn, Chongjie Zhang
Pages: 36902-36913 (12 pages)
Format: PDF Paper Download
Conference: Advances in Neural Information Processing Systems 35
Date/Location: Held 28 November - 9 December 2022, New Orleans, Louisiana, USA.
Series: Advances in Neural Information Processing Systems 35
Publisher: Neural Information Processing Systems Foundation, Inc. (NeurIPS)