前沿报道 - 深度强化学习实验室

正在加载...

加载论坛时出错，请强制刷新页面重试。

前沿报道

用ChatGPT实现强化学习DDPG算法
【RLC2024会议总结】关于 RL/ML 历史的讨论——Andrew Barto
触觉算法专家#
如何看待最新发布的Agent Q 方法？对行业有什么影响？
【重磅快讯】强化学习大牛John Schulman离职OpenAI, 曾开发PPO|TRPO|GAE等算法, 领导OpenAI强化学习团队！
强化学习中的最大熵模型校正(MAXIMUM ENTROPY MODEL CORRECTION)
【Nature子刊+开源代码】最大扩散强化学习(Maximum diffusion RL)
混合正交专家的多任务强化学习(MULTI-TASK REINFORCEMENT LEARNING)
奖励模型集合有助于缓解过度优化(Reward Model Ensembles)
重磅 | 南栖仙策发布强化学习工业决策软件REVIVE 1.0
Pytorch单文件实现离线强化学习CORL (Clean Offline Reinforcement Learning)
逆强化学习比标准强化学习更难吗？理论分析
【LSTM之父Jürgen Schmidhuber】利用循环世界模型和人工好奇心进行规划和强化学习
AGI Capabilities（通用人工智能能力）
集成强化学习(Ensemble Reinforcement Learning)综述
Scaling Is All You Need
Open RL Benchmark：综合跟踪强化学习实验
ICLR2024多智能体深度强化学习论文汇总(17篇)
【重磅顶会】ICLR2024年accept的301篇强化学习相关文章(附连接)
谷歌最新提出的AI大模型Gemini中用到哪些强化学习技术？

下一页 »

Document

关于实验室

社区使用规范
捐赠/Donate
E-mail联系我们
微信公众：DeepRLHub

实验室服务

开源项目: Github
开源项目: Gitee
Bilibili视频
CSDN博客

社区规范 | 违法和不良信息举报
本网站页面发布内容版权归发布作者和平台所有，本站仅做学术分享和学习交流使用，如有侵犯，请立即联系E-mail，我们将在24小时内进行处理和解决