首页 文章

从支持向量机移动到神经网络(反向传播)

提问于
浏览
1

我'm working with text recognition and currently I'm使用支持向量机方法 . 我也想尝试使用神经网络 . 我读了一些关于神经网络是如何工作的文档,但理论很重,我不喜欢这种架构 .

  • 目前,在SVM中,我有200个功能(分为4个主要类别),用于识别文本 . 如果我转向神经网络,有200个特征,是否意味着我将在输入层中有200个中子?

  • 有200个特征,这将如何导致神经网络的结构(在数字层(隐藏层)和中子方面)?

  • 在SVM中,我有一个类分类(基本上是真和假)和多类分类(标签),这种差异将如何应用于神经网络的输出层?

我也有几个一般问题:

  • 什么有助于确定隐藏层的数量和每个隐藏层内的中子数量?

  • 隐藏层的数量是否与准确性有关?

我是神经网络的新手,所以如果你能以一种明智的方式向我解释,那就太好了 . :)
非常感谢你 .

1 回答

  • 1

    第1点 - 它将是200个输入神经元,其中每个神经元被馈送二进制数或浮点数(优选地在-1到1范围内归一化) .

    第2/4点 - 大多数问题都通过一个隐藏层解决 . 当然,如果你开始使用神经网络,你应该坚持一个隐藏层 . 我还建议从少于200个输入神经元开始,尝试5或10.在复杂问题中使用多个隐藏层,例如,第一个隐藏层学习像狗,猫,马等宏观特征,下一个隐藏层学习更精细眼睛,鼻子,耳朵等功能

    没有明确的程序来决定隐藏神经元的数量 . 问题越复杂,理论上它需要的隐藏神经元就越多 . 如果您有10个输入神经元,请从20个隐藏神经元开始 . 如果它不起作用,其他地方可能出现问题 . 如果它确实有效,你可以减少隐藏神经元的数量,直到它失败 .
    你也可以从低位起步并开始工作 .

    第3点 - 对于真假分类,使用单个输出神经元,并使用0或1训练它 . 对于n类,使用n个编码中的1个 .

    第5点 - 没有 . 准确性是通过网络可以概括的程度来衡量的 - 即,它如何对数据执行前所未有的 . 通常,更多的训练数据=更准确 .

相关问题