有没有办法迭代每个状态,强制环境进入该状态,然后采取一个步骤然后使用返回的“info”字典来查看所有可能的后继状态是什么?

或者更简单的方法来恢复每个州的所有可能的后继状态,也许隐藏在某个地方?

我在网上看到一些名为MuJoKo的东西有类似set_state的功能,但是我不想创建一个新环境,我只想设置openAi gym已经提供的状态 .

上下文:尝试实现拓扑顺序值迭代,这需要创建一个图形,其中每个状态都具有任何操作可以将其转换为任何状态的边缘 .

我知道很明显在一些游戏中没有提供,但对于那些游戏来说,有没有办法呢?

(除了蛮力的游戏方法,我采取的每一步都没有采取任何我登陆的状态,直到我到达所有状态并看到一切,这取决于游戏可能需要永远)

这是我第一次使用OpenAi健身房,所以请尽可能详细解释 . 例如,我不知道Wrappers是什么 .

谢谢!