如何列出OpenAI健身房中每个州的可能继承状态？（严格用于普通MDP）-Java 学习之路

有没有办法迭代每个状态，强制环境进入该状态，然后采取一个步骤然后使用返回的“info”字典来查看所有可能的后继状态是什么？

或者更简单的方法来恢复每个州的所有可能的后继状态，也许隐藏在某个地方？

我在网上看到一些名为MuJoKo的东西有类似set_state的功能，但是我不想创建一个新环境，我只想设置openAi gym已经提供的状态 .

上下文：尝试实现拓扑顺序值迭代，这需要创建一个图形，其中每个状态都具有任何操作可以将其转换为任何状态的边缘 .

我知道很明显在一些游戏中没有提供，但对于那些游戏来说，有没有办法呢？

（除了蛮力的游戏方法，我采取的每一步都没有采取任何我登陆的状态，直到我到达所有状态并看到一切，这取决于游戏可能需要永远）

这是我第一次使用OpenAi健身房，所以请尽可能详细解释 . 例如，我不知道Wrappers是什么 .

谢谢！

如何列出OpenAI健身房中每个州的可能继承状态？ （严格用于普通MDP）