情况:针对一个整数 N,需要把它划分成4份,即N = N1 + N2 + N3 + N4。如果构造这样的observation呢, 即[N1, N2, N3, N4]。
用gym的space中的Multidiscrete或者Box可以给每个元素设定一个范围,但是问题是这四个元素之间有总和约束,难道需要在额外增加一个变量判断是否合规吗?(想问问还有没有其他可能的实现方式)谢谢大家!!!
lwj312 我理解为如果每一个因子都有约束的话,总和就在一个约束范围内,反过来肯定不行