正在加载...
请使用更现代的浏览器并启用 JavaScript 以获得最佳浏览体验。
加载论坛时出错,请强制刷新页面重试。
MAPPO算法训练效果好,评估效果一般
ccmmyy
有人遇到过这个问题吗?.eval()也开启了,但是就是开启评估模式的时候效果差很多,然后这个我的奖励看着也收敛了,在评估的时候几乎和训练时环境没啥变化都评估的效果不好。请各位大佬赐教!!!
Document