首页 文章

用Java实现用于Connect 4的Minimax算法

提问于
浏览
2

我正在尝试使用minimax(和alpha beta修剪)构建Connect 4游戏,主要是为了向自己证明我能做到 . 然而,我遇到的一个重大概念问题是如何实际使用minimax算法 . 我这样做的方法是我有一个AI类,它有一个函数可以执行返回int的minimax算法 .

public int minimax(Board board, int depth, int alpha, int beta, String player) {

    if(depth == 0 || board.getScore() >= 512) {
        return board.getScore();
    }

    else if(player.equals("computer")) {
        int temp = -1000000;
        for(Integer[] moves : board.availableMoves) {
            board.putPiece(player, moves[0]);
            temp = Math.max(temp, minimax(board, depth-1, alpha, beta, "human"));
            board.removePiece(moves[0], moves[1]);
            alpha = Math.max(alpha, temp);
            if (alpha >= beta) {
                break;
            }

        }
        return temp;
    }

    else {
        int temp = 1000000;
        for(Integer[] moves : board.availableMoves) {
            board.putPiece(player, moves[0]);
            temp = Math.min(temp, minimax(board, depth+1, alpha, beta, "computer"));
            board.removePiece(moves[0], moves[1]);
            beta = Math.min(beta, temp);
            if(alpha >= beta) {
                break;
            }
        }
        return temp;
    }
}

这是由名为computerMove()的Game类的函数调用的 .

public int computerMove() {
    Board tempBoard = board;
    int bestMove = 0;
    AI ai = new AI();
    ai.minimax(board, difficulty, -1000000, 1000000, "computer");

    return bestMove;
}

但是,如何处理返回的int?我如何利用它来实际移动这件作品?返回的int只是我能得到的最好的板子,对吧?它告诉我没有特别关于我应该做的位置或板 .

非常感谢任何和所有的帮助 .

谢谢,

1 回答

  • 1

    这些书都说只返回得分,但这对于实际玩游戏来说是不切实际的 . 当然,在任何地方保持最佳移动的开销可能会使程序变慢,因此通常使用驱动程序功能执行第一级扩展,并另外跟踪最佳移动 . 这有效地将实现包装在一个_1522592中,这只是一种说法,它返回顶级而不是分数的最佳移动 . 您可以在a little project I worked on last year中看到此示例 . 代码在C#中,但它足够接近Java以便您获得想法 .

    或者,您可以修改代码以返回具有分数和最佳移动的元组(具有多个字段的类) . 这比编写argmax包装器更容易(并且更加清洁IMO),但是如果没有一些额外的工程设计,这可能会导致minimax功能显着减慢,因为它会导致更多的分配 . 如果性能不是您的首要任务,那么这可能就是您的选择 .

    我还应该指出,你的实现至少有一个bug . 无论谁在玩,你的人类分支中的深度应该总是在减少,你可以为人类玩家增加深度 . 这意味着深度永远不会达到0,并且只有当玩家被确定为胜利者时才会击中基本情况 . 此外,在使用alpha beta时,重要的是董事会评估知道轮到谁以及谁是最大化的玩家,否则你会遇到很多难以发现的错误 . 你没有在这里显示这些代码,但我想指出这一点,因为它每次都会让我感觉到 .

相关问题