深度强化学习与强化学习的区别？

在强化学习中引入深度网络带来的效果提升有哪些，解决了强化学习的哪些局限性？
例如方便引入高维输入如图像信息，除此之外还有吗？

yinzikang 原理上说三层审计网络可以拟合任意函数，这也就促进了策略，指函数的represtation, 另外由于部分问题状态空间太大，导致诸如q-learning一样，在处理复杂的机器人时候很难实现收敛，这也是DQN2013版本取得突破性进展的原因

Document