• 问题求助
  • Stable Baselines3 & Stable Baselines3 Zoo项目代码阅读讨论

本帖主要面向Stable Baselines3项目Doc以及Stable Baselines3 Zoo的源码阅读讨论,欢迎大家一起参与

备注:请大家将问题在此处描述,评论区针对对应问题做回复

一、问题汇总

  1. 自己环境里的observation_space,不知道该怎么处理才能输入到神经网络,而不是Dict{}
  2. 待补充

    实验室官方助手

    针对问题1:使用gym.spaces.utils里面提供的flatten()方法,可以将observation_space的数据转化为asarray数组,进而可以输入到神经网络

    1 年 后

    dqn.learn中的参数total_timesteps是指训练的轮数还是每一轮中环境走的步数,以及如何将每一轮的奖励之和设置为优化的对象呢

    说点什么吧...
    Document