用DQN写的,但是无论如何都达不到Ground truth的值,这是为什么?如何改进??
ground truth 是在哪来的?
现在的结果非常得好,根本问题还是选取模型结构时,没有考虑周全。
axis?