上万的动作空间，还能用DQN算法吗？ - 深度强化学习实验室

上万的动作空间，还能用DQN算法吗？

heng

PonyShan

heng 说实话没遇到过这么大维度的，目测可以试试分层强化学习，但不知道效果

Learner

heng 考虑策略梯度算法啊

Document