• 离线强化学习 REVIVE专区
  • 「仙启教学视频」REVIVE SDK 行业应用——大滞后控制案例,使用数据驱动强化学习(离线强化学习)开发工具包,解决行业问题

「仙启」REVIVE SDK 行业应用,控制系列教程,结合工业控中大滞后控制案例展示如何使用REVIVE工具去解决工业控制中这一问题,教学视频已发布,欢迎小伙伴们查阅。

视频观看,详见南栖仙策B站:REVIVE SDK 行业应用视频

【视频概览】

1、大滞后控制特性

2、大滞后控制模拟器

  • 1)模拟器工作示意图
  • 2)模拟器核心代码
  • 3)采集历史数据

3、如何使用REVIVE SDK?

  • 1)绘制决策流图
  • 2)数据制作
  • 3)定义专家函数
  • 4)yaml文件生成&npz文件生成
  • 5)虚拟环境学习

    a、BC算法,分布直方图&rollout曲线图展示
    
    b、REVIVE算法,分布直方图&rollout曲线图展示
  • 6)定义奖励函数&策略训练

    a、BC算法策略控制双环境验证图,BC算法策略控制效果
    
    b、REVIVE算法策略控制双环境验证图,REVIVE算法策略控制效果
  • 7)BC算法和REVIVE算法策略在真实环境种控制效果对比

【支持和服务】

南栖仙策--POLIXIR 将标题更改为 「「仙启教学视频」REVIVE SDK 行业应用——大滞后控制案例,使用数据驱动强化学习(离线强化学习)开发工具包,解决行业问题」。
说点什么吧...
Document