我听说过的有模仿学习、逆强化学习、BatchRL,欢迎补充。可以分享一些最新的好工作吗?
GyChou
offline RL应该算吧
NanNan 嗯嗯,off-line rl = batch rl
GyChou 非常感谢,D4RL原来这个意思,我要搜一下。