「仙启」REVIVE SDK快速入门系列教程,结合冰箱温控案例展示如何使用REVIVE工具去完成自己的决策任务。
1、强化学习基础概念
2、使用尽可能少的数学公式和代码展示如何使用REVIVE工具去完成自己的决策任务
视频观看,详见南栖仙策B站:REVIVE SDK快速入门系列教程
【Part 1 主题】 「仙启」REVIVE 简介
【视频概览】
1)「仙启」REVIVE是什么?
2)「仙启」REVIVE具备什么功能?
3)「仙启」REVIVE能够完成什么类型的任务,解决哪些问题?
【Part 2 主题】 冰箱温控 Demo 及 REVIVE SDK工具关键步骤
【视频概览】
1)冰箱控制任务介绍
2)冰箱工作模拟器介绍
3)描述任务
4)使用REVIVE SDK训练冰箱压缩机控制策略
5)冰箱温度控制任务的决策流图
6)定义控制策略的优化目标
7)冰箱控制任务的历史数据
8)准备REVIVE-SDK需要的任务数据
【Part 3 主题】 在VScode绘制决策流图并定义奖励函数
【视频概览】
1)REVIVE SDK准备工作—REVIVE 三步法
a、绘制决策流图 b、定义奖励函数 c、整理历史数据
2)在VScode中绘制决策流图并定义奖励函数
【Part 4 主题】 使用较强探索性数据和BC学习
【视频概览】
1)行为克隆(BC)介绍
2)使用较强探索性数据和BC学习
【Part5 主题】 数据覆盖变窄时使用BC学习
【视频概览】
1)行为克隆(BC)介绍
2)数据覆盖变窄时使用BC学习
【Part6 主题】 数据覆盖变窄时使用BC学习
【视频概览】
1)环境学习新方法——REVIVE
2)不同算法学习虚拟环境,策略优化性能对比
【支持和服务】
1)REVIVE SDK官方下载地址:REVIVE官网
2)REVIVE SDK帮助文档:REVIVE帮助中心
3)官方技术交流QQ群:861711940
4)官方技术支持邮箱:offlinerl@polixir.ai