最近在阅读DPG, 发现DPG这个方法从14-18年有DDPG,TD3,D4PG大的改进,但貌似之后就基本没有了。 想问一下大家这个方向上有什么最新的文章吗?
目前基本算法方面都是组合,改进啥的
常见的强化算法如论坛里图结构所示: http://deeprlhub.com/d/228-65