我正在和我的一些朋友一起开发一个视频游戏,用于我们在AI中的课程 .

我们都有不同的约束;我们的目的是使用神经网络来定义AI的行为 . 这部分是Python .

基本上,我们的游戏就像Towerfall,但更简单 . Map 是静态的,玩家有5条生命,或者AI . 您可以向左,向右,向右移动并单击以在光标位置拍摄子弹 . 所以这是一场致死的战斗 .

最初,我们考虑使用遗传算法来训练我们的网络 . 我们定义了拓扑结构,无论它是什么,我们计划使用GA来优化权重 .

计划是生成人口,在我们的游戏中直接测试NN,收集结果(适应度?)并使用之前的排名生成新的人口 .

但我们并不真正知道如何实现这一点,或者如果可能的话或者是否会产生良好的结果 .

我们应该在复制期间使用权重的加权平均值吗?如何应用“突变”?我们应该用什么结构来代表我们的NN?

如果您有任何线索或建议..!

非常感谢 !