首页 文章
  • 0 votes
     answers
     views

    Gym(openAI)环境动作空间取决于实际状态

    我正在使用gym toolkit来创建我自己的env和keras-rl以在代理中使用我的env . 问题是我的行动空间变化,这取决于实际状态 . 例如,我有46个可能的动作,但是给定某个状态只有7个可用,并且我无法找到建模的方法 . 我读过那个问题open-ai-enviroment-with-changing-action-space-after-each-step 但这并没有解决我的问题 . ...

热门问题