首页 文章

使用深度学习标记跑道以进行定位和检测

提问于
浏览
-2

Sample Ariel view of Runway that needs to be localizedstrong text

上面显示的是需要进行本地化的跑道示例图像(跑道周围的边界框)我知道如何在tensorflow中完成图像分类,我的问题是如何 label 此图像用于训练?我希望模型输出4个数字来绘制边界框 . 在CS231n中,他们说我们使用分类器和本地化头 . 但是我的模型如何知道400x400图像中的移动通道在哪里?

简而言之,我如何 LABEL 此图像进行培训?因此,在训练之后,我的模型会检测并定位(在此跑道周围绘制边界框)来自输入图像的跑道 . 请随时给我链接讲座,视频,github教程,从中我可以了解到这一点 . **********不是CS231n **********我已经参加了这个讲座,无法理解如何使用他们的方法来解决 . 谢谢

2 回答

  • 1

    如果要预测边界框,则标签也是边界框 . 这是大多数物体检测系统用于训练的内容 . 您可以只有边界框标签,或者如果要检测多个对象类,则还需要每个边界框的类标签 .

  • 1

    从谷歌或任何仅包含跑道照片的资源中收集数据(从一些更近的视图) . 我建议你使用预先训练好的图像分类网络(如VGG,Alexnet等)并使用下载的跑道数据微调这个网络 .

    在跑道数据集上构建好的图像分类器后,您可以使用任何流行的算法从图像生成提议区域 .

    现在把所有提案区域分别传递给分类网络并查看天气这个网络正在将提议的给定区域分类为正面或负面 . 如果它分类为肯定,那么很可能你的对象(跑道)存在于该区域 . 否则就不是 .

    如果根据分类器存在很多对象存在的提议区域,则可以使用非最大抑制算法来减少正提议的数量 .

相关问题