Eliminating Primacy Bias in Online Reinforcement Learning by Self-Distillation

Jingchen Li, Haobin Shi, Huarui Wu, Chunjiang Zhao, Kao Shing Hwang

School of Computer Science

Research output: Contribution to journal › Article › peer-review

1 Scopus citations