在强化学习中引入深度网络带来的效果提升有哪些,解决了强化学习的哪些局限性? 例如方便引入高维输入如图像信息,除此之外还有吗?
yinzikang 原理上说三层审计网络可以拟合任意函数,这也就促进了策略,指函数的represtation, 另外由于部分问题状态空间太大,导致诸如q-learning一样,在处理复杂的机器人时候很难实现收敛,这也是DQN2013版本取得突破性进展的原因