首页 文章

OpenCV迭代随机森林训练

提问于
浏览
6

我正在使用随机森林算法作为我论文项目的分类器 . 训练集由数千个图像组成,并且对于每个图像,约2000个像素被采样 . 对于每个像素,我有成千上万的功能 . 由于我目前的硬件限制(8G的ram,可能可扩展到16G),我能够在内存中只为一个图像拟合样本(即每像素的特征) . 我的问题是:是否可以多次调用火车方法,每次使用不同的图像样本,并在每次调用时自动更新统计模型?我对变量重要性特别感兴趣,因为在我使用整个功能集训练完整的训练集之后,我的想法是将功能的数量从几十万减少到大约2000,只保留最重要的功能 .

感谢Daniele的任何建议

2 回答

  • 1

    我不认为该算法支持增量训练 . 您可以考虑使用其他功能缩减方法在训练之前减小描述符的大小 . 或者估算所有训练图像中随机像素子集的变量重要性,尽可能多地记录在你的记忆中......

  • 2

    请参阅我对this post的回答 . 有随机森林的增量版本,它们可以让你训练更大的数据 .

相关问题