正在加载...
请使用更现代的浏览器并启用 JavaScript 以获得最佳浏览体验。
加载论坛时出错,请强制刷新页面重试。
强化学习算法训练的时候需要固定种子吗?还是评估的时候固定种子就行?
RLer
强化学习算法训练的时候需要固定种子吗?还是评估的时候固定种子就行?
为了对算法有个综合的评价,准备采用5个种子取平均+标准差,所以训练需要固定种子吗?
coco-deeprlhub
一般跑两三个种子
Document