强化学习算法训练的时候需要固定种子吗？还是评估的时候固定种子就行？ - 深度强化学习实验室

强化学习算法训练的时候需要固定种子吗？还是评估的时候固定种子就行？

RLer

强化学习算法训练的时候需要固定种子吗？还是评估的时候固定种子就行？

为了对算法有个综合的评价，准备采用5个种子取平均+标准差，所以训练需要固定种子吗？

coco-deeprlhub

一般跑两三个种子

Document