既然当前TD3算法在很多问题上表现要优于DDPG,那么为什么没有看到,结合MADDPG算法和TD3算法思路的MATD3的相关文章呢,如果已经有的话麻烦诸位给个文章链接。
丘小七 之前有把sac应用到multi-agent的, 网上有好几篇类似的论文, 你用multi-agent soft actor critic Google下就能找到好几篇