Mask R-CNN的最佳图像尺寸，更快的R-CNN，使用预训练模型（Keras，Tensorflow）

提问于 2024-04-26T14:53:27+08:00

浏览次

1

许多现有的Tensorflow和Keras CNN代码示例使用相同的大小来训练图像，通常是299 * 299,244 * 244,256 * 256，以及更多 . 我认为这部分取决于与预先训练的模型的兼容性，以及架构本身 .

我还在评估架构，但最终可能会使用Resnet，Inception或Xception，以及Tensorflow或Keras，使用Mask R-CNN（或者可能更快的R-CNN） . 要分析的目标图像在1024 * 1024的范围内，但可以分成更小的分区 .

鉴于可用的预训练模型，是否有训练图像尺寸可以提供任何优势？我想避免之后调整大小，因为在某些情况下会降低图像的清晰度 .

1 回答

1

好的，我找到了一个部分答案：

Girshick的快速R-CNN显然对输入图像进行内部缩放，使得它们的较短尺寸为600像素，但较大的边缘被钳制在1000像素 . 听起来这是由于可用GPU的内存限制 .

鉴于图像缩放将导致CPU命中，并且还会导致边缘的一些混叠，似乎在预处理图像方面可能具有优势 .

我还没有找到Mask R-CNN的等效信息 .

回复于 2024-04-26T14:53:27+08:00

相关问题