「仙启」REVIVE SDK快速入门系列教程,结合冰箱温控案例展示如何使用REVIVE工具去完成自己的决策任务。

1、强化学习基础概念

2、使用尽可能少的数学公式和代码展示如何使用REVIVE工具去完成自己的决策任务

视频观看,详见南栖仙策B站:REVIVE SDK快速入门系列教程

【Part 1 主题】 「仙启」REVIVE 简介

【视频概览】

1)「仙启」REVIVE是什么?

2)「仙启」REVIVE具备什么功能?

3)「仙启」REVIVE能够完成什么类型的任务,解决哪些问题?

【Part 2 主题】 冰箱温控 Demo 及 REVIVE SDK工具关键步骤

【视频概览】

1)冰箱控制任务介绍

2)冰箱工作模拟器介绍

3)描述任务

4)使用REVIVE SDK训练冰箱压缩机控制策略

5)冰箱温度控制任务的决策流图

6)定义控制策略的优化目标

7)冰箱控制任务的历史数据

8)准备REVIVE-SDK需要的任务数据

【Part 3 主题】 在VScode绘制决策流图并定义奖励函数

【视频概览】

1)REVIVE SDK准备工作—REVIVE 三步法

a、绘制决策流图 b、定义奖励函数 c、整理历史数据

2)在VScode中绘制决策流图并定义奖励函数

【Part 4 主题】 使用较强探索性数据和BC学习

【视频概览】

1)行为克隆(BC)介绍

2)使用较强探索性数据和BC学习

【Part5 主题】 数据覆盖变窄时使用BC学习

【视频概览】

1)行为克隆(BC)介绍

2)数据覆盖变窄时使用BC学习

【Part6 主题】 数据覆盖变窄时使用BC学习

【视频概览】

1)环境学习新方法——REVIVE

2)不同算法学习虚拟环境,策略优化性能对比

【支持和服务】

1)REVIVE SDK官方下载地址:REVIVE官网

2)REVIVE SDK帮助文档:REVIVE帮助中心

3)官方技术交流QQ群:861711940

4)官方技术支持邮箱:offlinerl@polixir.ai

1 个月 后
23 天 后
南栖仙策--POLIXIR 将标题更改为 「「仙启」REVIVE SDK快速入门系列教程,玩转数据驱动强化学习(离线强化学习)开发工具包 」。
说点什么吧...
Document