我'm working with text recognition and currently I'm使用支持向量机方法 . 我也想尝试使用神经网络 . 我读了一些关于神经网络是如何工作的文档,但理论很重,我不喜欢这种架构 .
-
目前,在SVM中,我有200个功能(分为4个主要类别),用于识别文本 . 如果我转向神经网络,有200个特征,是否意味着我将在输入层中有200个中子?
-
有200个特征,这将如何导致神经网络的结构(在数字层(隐藏层)和中子方面)?
-
在SVM中,我有一个类分类(基本上是真和假)和多类分类(标签),这种差异将如何应用于神经网络的输出层?
我也有几个一般问题:
-
什么有助于确定隐藏层的数量和每个隐藏层内的中子数量?
-
隐藏层的数量是否与准确性有关?
我是神经网络的新手,所以如果你能以一种明智的方式向我解释,那就太好了 . :)
非常感谢你 .
1 回答
第1点 - 它将是200个输入神经元,其中每个神经元被馈送二进制数或浮点数(优选地在-1到1范围内归一化) .
第2/4点 - 大多数问题都通过一个隐藏层解决 . 当然,如果你开始使用神经网络,你应该坚持一个隐藏层 . 我还建议从少于200个输入神经元开始,尝试5或10.在复杂问题中使用多个隐藏层,例如,第一个隐藏层学习像狗,猫,马等宏观特征,下一个隐藏层学习更精细眼睛,鼻子,耳朵等功能
没有明确的程序来决定隐藏神经元的数量 . 问题越复杂,理论上它需要的隐藏神经元就越多 . 如果您有10个输入神经元,请从20个隐藏神经元开始 . 如果它不起作用,其他地方可能出现问题 . 如果它确实有效,你可以减少隐藏神经元的数量,直到它失败 .
你也可以从低位起步并开始工作 .
第3点 - 对于真假分类,使用单个输出神经元,并使用0或1训练它 . 对于n类,使用n个编码中的1个 .
第5点 - 没有 . 准确性是通过网络可以概括的程度来衡量的 - 即,它如何对数据执行前所未有的 . 通常,更多的训练数据=更准确 .