• 离线强化学习
  • 【更新•基线(baseline)方案详解与代码示例】 AI决策•强化学习落地挑战赛——学习制定平等的促销策略

本文更新了南栖仙策为挑战赛提供的基线方案,对基线方案做了更详细说明,以及说明了如何评估和改善基线训练出的环境和模型策略。欢迎大家下载查阅。

1、基线方案基于Polixir Revive SDK 【 下载地址
2、基线方案详细文档见附件

starting-kit.pdf
14MB

3、基线代码,样例提交代码,以及用于指导参赛者学习一遍完整流程的jupyter notebook文件参见比赛所提供的starting_kit.zip

starting-kit.zip
810kB

notebook的目录如下:

说点什么吧...
Document