奖励函数 - 深度强化学习实验室

正在加载...

加载论坛时出错，请强制刷新页面重试。

奖励函数

涉及强化学习中的奖励工程，奖励函数，reward shaping等。

请问如何评价一个奖励函数设计的好坏呢？
Cliff Diving: 探索强化学习环境中的奖励表面
stable baseline3中TD3尝试股票交易碰到的问题
奖励函数这样，是陷入局部最小值了吗？

Document

关于实验室

社区使用规范
捐赠/Donate
E-mail联系我们
微信公众：DeepRLHub

实验室服务

开源项目: Github
开源项目: Gitee
Bilibili视频
CSDN博客

社区规范 | 违法和不良信息举报
本网站页面发布内容版权归发布作者和平台所有，本站仅做学术分享和学习交流使用，如有侵犯，请立即联系E-mail，我们将在24小时内进行处理和解决