如果action为2维时,是否是输出二维的高斯分布再采样?
这取决于你对策略的假设。action的2个维度互相独立,使用2个一维高斯分布即可。如果不独立,可能要考虑多维高斯分布的假设了
GyChou 非常感谢