Cournot Policy Model: Rethinking centralized training in multi-agent reinforcement learning

Jingchen Li, Yusen Yang, Ziming He, Huarui Wu, Haobin Shi, Wenbai Chen

计算机学院

科研成果: 期刊稿件 › 文章 › 同行评审

1 引用（Scopus）

Computer Science

Engineering

Chemical Engineering

Economics, Econometrics and Finance