跳到主要导航
跳到搜索
跳到主要内容
西北工业大学 国内
English
中文
国内
简介
研究单位
科研成果
按专业知识、名称或附属进行搜索
Model-Based Offline Adaptive Policy Optimization with Episodic Memory
Hongye Cao, Qianru Wei,
Jiangbin Zheng
, Yanqing Shi
软件学院
Northwestern Polytechnical University Xian
Nanjing Agricultural University
科研成果
:
书/报告/会议事项章节
›
会议稿件
›
同行评审
2
引用 (Scopus)
综述
指纹
指纹
探究 'Model-Based Offline Adaptive Policy Optimization with Episodic Memory' 的科研主题。它们共同构成独一无二的指纹。
分类
加权
按字母排序
Computer Science
Reinforcement Learning
100%
Optimization Policy
100%
And-States
25%
Superior Performance
25%
Generalization Ability
25%
Active Learning
25%
Engineering
Reinforcement Learning
100%
Adaptability
50%
State-of-the-Art Method
25%
Learning Task
25%
Set Method
25%
Strength Constraint
25%