正在加载...
请使用更现代的浏览器并启用 JavaScript 以获得最佳浏览体验。
加载论坛时出错,请强制刷新页面重试。
MADDPG平均奖励不收敛
yihuang
环境是计算卸载,奖励值根据时延、能耗以及成本计算,为什么奖励没有变好的趋势,而是直接就是在一个范围呢波动呢,反而时延、能耗、成本有变好趋势,从1开始,然后收敛到某一个值范围内
Document