首页 文章
  • 1 votes
     answers
     views

    蒙特卡罗搜索树如何运作?

    尝试使用像这样的YouTube视频和论文来学习MCST . http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Applications_files/grand-challenge.pdf 然而,除了高级理论解释之外,我没有太多运气了解细节 . 以下是上述论文的一些引用和我的问题 . 选择阶段:MCTS迭代地选择当前状态的得分最高的子节点 . 如果当前状态...
  • 0 votes
     answers
     views

    蒙特卡洛树搜索交替

    任何人都可以澄清一下(因为我没有在任何地方找到任何明确的例子)MCTS算法为第二个玩家迭代 . 我看起来似乎只是看起来像是在玩,例如P1每次移动 . 我理解一个代理的步骤,但我从来没有发现任何显示P2放置其计数器的代码,这在生长树时肯定会发生 . 基本上我会期望: 对于每个人: select node Player1展开Player1 选择节点Player2展开播放器2 推出backpropoga...
  • 2 votes
     answers
     views

    蒙特卡洛树搜索 - “最有前途”的移动功能

    我试图实现tic-tac-toe hello-world MCTS游戏玩家,但我遇到了一个问题 . 在模拟游戏并选择“最有希望的”(利用/探索)节点时,我只考虑总胜数(“利用”部分) - 这会导致某些问题,所得算法根本不具防御性 . 因此在选择之间 移动导致(100次抽奖; 10次失败) 移动导致(1胜; 109输) 选择较差的一个(1; 109),因为我的uct函数贪婪计算avg w...
  • 1 votes
     answers
     views

    蒙特卡罗树搜索 - 处理游戏结束节点

    我已经实现了一个运行良好的4人游戏的MCTS,但是当游戏结束移动在实际的树而不是推出时我不确定我理解扩展 . 在开始时,游戏中止/失败位置仅在首次展示中找到,我了解如何对这些进行评分并将它们传播回树上 . 但是随着游戏的进行,我最终找到了一个由UCB1选择的叶子节点,由于它是一个失败的位置,没有可能的移动,所以无法扩展,所以没有什么可以扩展,也没有“游戏”的游戏 . 目前我只是将其作为最后一名球员...

热门问题