我想使用Tensorflow Object Detection API识别一系列网络摄像头图像中的对象 . 在COCO数据集上预训练的Faster RCNN models似乎是合适的,因为它们包含我需要的所有对象类别 .
但是,我想在识别每个图像中相当小的对象时提高模型的性能 . 如果我理解正确,我需要编辑config file中的锚 scales
参数以使模型使用较小的边界框 .
我的问题是:
-
调整此参数后,是否需要在整个COCO数据集上重新训练模型?或者有没有办法改变模型只是为了推理并避免任何重新训练?
-
是否有任何其他提示/技巧可以成功识别小物体,而不是将图像裁剪成部分并分别对每个部分进行推理?
背景信息
我目前正在向模特提供1280x720张图像 . 大约200x150像素,我发现检测物体更难 .
1 回答
不幸的是,你需要重新训练,因为重量确实取决于锚的形状 .
具有更高分辨率的特征图应该有所帮助(但会减慢过程),因此更改特征提取器以获得具有较少输入尺寸减小的特征提取器(步幅> 1的最大池通常会减小空间大小)或放大图像初始图像缩放器中的一点 .