我正在研究一个项目,以检测以下类{汽车,卡车,公共汽车},然后提取相应的车牌 .

这个问题是关于各个类的检测 . 我使用传统的方法,我使用线性SVM的HOG功能,它的工作但精度低 . 我正在尝试研究CNN的基于深度学习的检测,它已经显示出更高的准确性 . 像R-CNN这样的论文非常精彩,我完全理解它是如何运作的 .

最近,YOLO模型显示出非常快速的检测,这非常有趣 . 如果我能正确猜测,那么YOLO大致类似于DPM .

通常,YOLO具有24个卷积层和2个完全连接的层 . NVIDIA DIGITS基于这篇YOLO论文实现了一个DetectNet . 令我感到困惑的是,NVIDIA的DetectNet没有任何完全连接的图层(Caffe Model File) . 相反,来自最后一个卷积层的输出通过一个减少维数的卷积层,我认为这对于拥有一个对象有一定的信心 .

Question 1

但我不明白卷积层如何取代FC层并学会预测对象?对此的详细解释将非常有帮助 .