影响DQN学习性能的关键因素？

请问大家在使用DQN网络在离散动作选择的条件下进行多目标问题的优化过程中，子目标之间设置一定的权重系数比，换了很多超参数发现还是处于局部最优（即只考虑优化一个子目标），想请问一下大家这可能是什么原因或一些影响DQN性能的关键因素，谢谢。

Document