Uncoupled and Convergent Learning in Two-Player Zero-Sum Markov Games with Bandit Feedback

Uncoupled and Convergent Learning in Two-Player Zero-Sum Markov Games with Bandit Feedback

Item #:: 075280-1579
UPC:

Download PDF

Details

DOI: https://doi.org/10.52202/075280-1579
Author(s): Yang Cai, Haipeng Luo, Chen-Yu Wei, Weiqiang Zheng
Pages: 36364-36406 (43 pages)
Format: PDF Paper Download
Conference: Advances in Neural Information Processing Systems 36
Date/Location: Held 10-16 December 2023, New Orleans, Louisiana, USA.
Series: Advances in Neural Information Processing Systems 36
Publisher: Neural Information Processing Systems Foundation, Inc. (NeurIPS)

Description

Members/Attendees

Tab 4

Details
Description
Members/Attendees
Tab 4

DOI: https://doi.org/10.52202/075280-1579
Author(s): Yang Cai, Haipeng Luo, Chen-Yu Wei, Weiqiang Zheng
Pages: 36364-36406 (43 pages)
Format: PDF Paper Download
Conference: Advances in Neural Information Processing Systems 36
Date/Location: Held 10-16 December 2023, New Orleans, Louisiana, USA.
Series: Advances in Neural Information Processing Systems 36
Publisher: Neural Information Processing Systems Foundation, Inc. (NeurIPS)