深度强化学习的测试集该怎么确定呢?为什么总是感觉测试集只能源自于训练集?就比如说用深度强化学习去训练一个迷宫,那测试的时候不还得是同一个迷宫吗?
就拿DQN算法来说
heng 强化学习一般不是这么说的
强化学习是在测试集上训练的
实验室官方助手 那请问DQN算法是只能现学现用吗