深度强化学习的测试集和训练集怎么区分 - 深度强化学习实验室

深度强化学习的测试集和训练集怎么区分

heng

深度强化学习的测试集该怎么确定呢？为什么总是感觉测试集只能源自于训练集？就比如说用深度强化学习去训练一个迷宫，那测试的时候不还得是同一个迷宫吗？

就拿DQN算法来说

实验室官方助手

heng 强化学习一般不是这么说的

Obnay

强化学习是在测试集上训练的

heng

实验室官方助手那请问DQN算法是只能现学现用吗

Document