深度强化学习在无人驾驶中的应用场景有哪些？可靠吗？

目前正在研究强化学习，不知道无人驾驶中应用场景咋样。
感觉不靠谱的 RL + 不靠谱的自动驾驶==翻车？？

各位大佬们如何看？一起讨论下

个人认为难点还是在于连续的序列决策，目前自动驾驶的摄像头、激光雷达、毫米波雷达以及GPS等信号状态特别多，特别是摄像头、激光雷达 采集到的数据比较复杂，representation 是一个非常难的问题

Jevon 赞同你的观点，其实无人车本身就是部分可观察的复杂环境

开放、动态、随机、部分可观察的复杂无人车场景下，drl也玄

Document