请问训练强化学习算法和测试强化学习算法时,随机种子应该如何设置?(1)训练算法时需要固定随机种子吗?(2)测试算法时需要固定随机种子吗?(3)如果固定随机种子,训练和测试的随机种子值相同吗?(4)为什么虽然在代码中设置了随机种子,但每次运行得到的结果还是不同?