A novel policy based on action confidence limit to improve exploration efficiency in reinforcement learning

Fanghui Huang, Xinyang Deng, Yixin He, Wen Jiang

School of Electronics and Information

Research output: Contribution to journal › Article › peer-review

13 Scopus citations

Computer Science