正在加载...
请使用更现代的浏览器并启用 JavaScript 以获得最佳浏览体验。
加载论坛时出错,请强制刷新页面重试。
求助,QMIX算法官方代码的agent决策网络是共用的吗?
FLBa9762
debug官方源代码的时候,发现每次决策的时候好像使用的是同一个RNNAgent网络,真实情况是这样的吗?这样做不会有什么问题吗?(期待有懂得的大佬解答!)
Document