问题1: 2021限制太强, 我看大家答的挺多的TAT, AAAI-2021 搜了下放两篇(笑)
1. Foresee then Evaluate: Decomposing Value Estimation with Latent Future Prediction
2. Uncertainty-Aware Action Advising for Deep Reinforcement Learning Agents
问题2: 支持GPU加速环境: @NVIDIA: Isaac Gym
问题3: 使用强化学习来加速芯片设计: @DeepMind: A graph placement methodology for fast chip design
问题4: 如何提升现有RL算法的采样效率, 期待 Offline RL 的发展
问题5: Constrained RL 与 Interactive RL (很早就有的概念说是新的方向有点牵强, 但是我相信时间会证明什么更有用)
问题6: 年轻学者的话, 其他大佬已经列举很多了, 前些日子办的 IJCAI-SAIA-YES 也有很多:
以上就不一一列举了, 其他补充下: 魏宁(大大送本书呗) 马腾宇 张伟楠 杨耀东 田渊栋 张海峰 郝晓田 毛航宇 等等
补充提问下, 抛个转不算回答了哈哈
问题4: 在游戏场景自动化生成设计 和 游戏NPC行为设计 以提高游戏体验这些方面, 强化学习是否有比较好的解决方案了, 能做到什么程度?
目前在调研这方面的内容, 也可以看作一个待解决问题吧。如果有哪位大大对这个比较熟悉希望可以进一步交流下。