首页 文章

深度学习图像分类[关闭]

提问于
浏览 1943
18

在阅读了几篇关于深度学习和深度信念网络的论文后,我对它的工作方式有了基本的了解 . 但仍然坚持最后一步,即分类步骤 . 我在互联网上发现的大多数实现都涉及到生成 . (MNIST数字)

是否有某些解释(或代码)可用于讨论使用DBN对图像(最好是自然图像或对象)进行分类?

此外,方向上的一些指示将非常有用 .

3 回答

  • 24

    The basic idea

    目前,对图像分类问题(例如ImageNet)的最先进的深度学习通常是"deep convolutional neural networks"(Deep ConvNets) . 他们看起来大致像Krizhevsky et al这样的ConvNet配置:
    enter image description here

    对于 inference (classification) ,您将图像输入左侧(注意左侧的深度为3,对于RGB),通过一系列卷积滤波器进行处理,并在右侧喷出1000维向量侧 . 这张照片特别适用于ImageNet,它专注于对1000类图像进行分类,因此1000d矢量是"score of how likely it is that this image fits in the category."

    Training 神经网络只是稍微复杂一点 . 对于训练,您基本上会重复进行分类,并且经常进行反向传播(参见Andrew Ng的讲座)以改进网络中的卷积滤波器 . 基本上,反向传播要求"what did the network classify correctly/incorrectly? For misclassified stuff, let's fix the network a little bit."


    Implementation

    Caffe 是深度卷积神经网络的一种非常快速的开源实现(比Krizhevsky等人的_695512更快) . Caffe代码非常容易阅读;每种类型的网络层基本上有一个C文件(例如卷积层,最大池层等) .

  • 2

    您应该在用于生成的网络顶部使用softmax图层(http://en.wikipedia.org/wiki/Softmax_activation_function),并使用反向传播来微调最终网络 .

  • 2

    这些天人们开始在分类层中使用SVM .

    深度学习正在非常自由和广泛地发展 .

相关问题