正在加载...
请使用更现代的浏览器并启用 JavaScript 以获得最佳浏览体验。
加载论坛时出错,请强制刷新页面重试。
全部主题
ACM图灵奖授予强化学习领域的两位奠基人: Andrew Barto 和 Richard Sutton
国内外做强化学习的老师,高校以及公司总结
MAPPO算法训练效果好,评估效果一般
MAPPO训练效果好训练效果一般
最近专注在给mt大模型团队beam项目招募强化学习的算法同学,有兴趣做下一代颠覆级AI产品的同学欢迎多多交流呀!
逐际动力发售首款多形态双足机器人TRON 1
逐际动力发布 LimX VGM 具身机器人操作算法
多级脉冲机动追逃博弈
Tron1首款多形态双足机器人——人形RL科研入门不二之选
DQN奖励往差的跑、跑好了后跳水,求助
强化学习路线图
数学模型转化为强化学习环境
2024图灵奖得主采访Richard S.Sutton解释强化学习的本质
京东JD:强化学习方向算法工程师(实习生OR正式员工)招聘
强化学习框架推荐
上海算法创新研究院:推理大模型算法实习生招聘(强化方向)
超大动作空间问题求助
途游游戏在招强化学习岗位,欢迎投递交流
DRL自写环境
用ChatGPT实现强化学习DDPG算法
下一页 »
Document