Reward prediction ensemble 与Inverse Reinforcement Learning,有区别吗?是不是说Reward prediction ensemble 是inverse reinforcement learning中的一个特例?
qaz123zz00 没接触过哎