OpenCV迭代随机森林训练-Java 学习之路

我正在使用随机森林算法作为我论文项目的分类器 . 训练集由数千个图像组成，并且对于每个图像，约2000个像素被采样 . 对于每个像素，我有成千上万的功能 . 由于我目前的硬件限制（8G的ram，可能可扩展到16G），我能够在内存中只为一个图像拟合样本（即每像素的特征） . 我的问题是：是否可以多次调用火车方法，每次使用不同的图像样本，并在每次调用时自动更新统计模型？我对变量重要性特别感兴趣，因为在我使用整个功能集训练完整的训练集之后，我的想法是将功能的数量从几十万减少到大约2000，只保留最重要的功能 .

感谢Daniele的任何建议

2 回答

1

我不认为该算法支持增量训练 . 您可以考虑使用其他功能缩减方法在训练之前减小描述符的大小 . 或者估算所有训练图像中随机像素子集的变量重要性，尽可能多地记录在你的记忆中......

回复于 2024-04-27T23:37:22+08:00
2

请参阅我对this post的回答 . 有随机森林的增量版本，它们可以让你训练更大的数据 .

回复于 2024-04-27T23:37:22+08:00

OpenCV迭代随机森林训练

2 回答

相关问题