目前正在研究强化学习,不知道无人驾驶中应用场景咋样。 感觉不靠谱的 RL + 不靠谱的自动驾驶==翻车??
各位大佬们如何看?一起讨论下
PonyShan
个人认为难点还是在于连续的序列决策,目前自动驾驶的摄像头、激光雷达、毫米波雷达以及GPS等信号状态特别多,特别是摄像头、激光雷达 采集到的数据比较复杂,representation 是一个非常难的问题
Jevon 赞同你的观点,其实无人车本身就是部分可观察的复杂环境
开放、动态、随机、部分可观察的复杂无人车场景下,drl也玄