正在加载...
请使用更现代的浏览器并启用 JavaScript 以获得最佳浏览体验。
加载论坛时出错,请强制刷新页面重试。
上万的动作空间,还能用DQN算法吗?
heng
PonyShan
heng
说实话没遇到过这么大维度的,目测可以试试分层强化学习,但不知道效果
Learner
heng
考虑策略梯度算法啊
Document