请问训练强化学习算法和测试强化学习算法时,随机种子应该如何设置?(1)训练算法时需要固定随机种子吗?(2)测试算法时需要固定随机种子吗?(3)如果固定随机种子,训练和测试的随机种子值相同吗?(4)为什么虽然在代码中设置了随机种子,但每次运行得到的结果还是不同?
不知道你用的哪个环境、哪个算法呢?正常来说设置种子是为了可复现性,设置了种子运行结果是不会变的。每次运行结果不用的原因可能是你的随机种子没有设置全,比如:环境需要设置种子、算法初期的随机探索需要设置种子、噪声需要设置种子等等,只要有随机性产生的地方都要设置种子,才能保证运行结果相同。