Java 学习之路

1 votes

answers

views

蒙特卡罗搜索树如何运作？

尝试使用像这样的YouTube视频和论文来学习MCST . http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Applications_files/grand-challenge.pdf 然而，除了高级理论解释之外，我没有太多运气了解细节 . 以下是上述论文的一些引用和我的问题 . 选择阶段：MCTS迭代地选择当前状态的得分最高的子节点 . 如果当前状态...

montecarlo monte-carlo-tree-search
0 votes

answers

views

蒙特卡洛树搜索交替

任何人都可以澄清一下（因为我没有在任何地方找到任何明确的例子）MCTS算法为第二个玩家迭代 . 我看起来似乎只是看起来像是在玩，例如P1每次移动 . 我理解一个代理的步骤，但我从来没有发现任何显示P2放置其计数器的代码，这在生长树时肯定会发生 . 基本上我会期望：对于每个人： select node Player1展开Player1 选择节点Player2展开播放器2 推出backpropoga...

artificial-intelligence game-ai monte-carlo-tree-search
2 votes

answers

views

蒙特卡洛树搜索 - “最有前途”的移动功能

我试图实现tic-tac-toe hello-world MCTS游戏玩家，但我遇到了一个问题 . 在模拟游戏并选择“最有希望的”（利用/探索）节点时，我只考虑总胜数（“利用”部分） - 这会导致某些问题，所得算法根本不具防御性 . 因此在选择之间移动导致（100次抽奖; 10次失败）移动导致（1胜; 109输）选择较差的一个（1; 109），因为我的uct函数贪婪计算avg w...

tic-tac-toe montecarlo game-theory monte-carlo-tree-search
1 votes

answers

views

蒙特卡罗树搜索 - 处理游戏结束节点

我已经实现了一个运行良好的4人游戏的MCTS，但是当游戏结束移动在实际的树而不是推出时我不确定我理解扩展 . 在开始时，游戏中止/失败位置仅在首次展示中找到，我了解如何对这些进行评分并将它们传播回树上 . 但是随着游戏的进行，我最终找到了一个由UCB1选择的叶子节点，由于它是一个失败的位置，没有可能的移动，所以无法扩展，所以没有什么可以扩展，也没有“游戏”的游戏 . 目前我只是将其作为最后一名球员...

artificial-intelligence monte-carlo-tree-search

蒙特卡罗搜索树如何运作？

蒙特卡洛树搜索交替

蒙特卡洛树搜索 - “最有前途”的移动功能

蒙特卡罗树搜索 - 处理游戏结束节点

热门问题