代码运行的环境是pytorch2.1.0 gym0.26.2 python3.9 代码已放置于gitee上了。 链接在这https://gitee.com/sjdadasdubuntu/drl.git
jiofly 看你使用了自己的路径规划环境,其实算法不收敛还有一个比较重要的原因就是“奖励函数”,如何奖励函数有问题,即使再优秀的算法估计也是白费功夫,建议核查一下