我有一个数据集,它有2个功能和10000个样本 . 我想将这两个功能转换(集成)为一个功能,以便进一步分析 . 所以我想使用特征提取方法 . 由于两个特征之间的关系不是线性的,我想使用传统PCA以外的方法 .
由于样本的数量远远大于特征的数量,我认为自动编码器是一种很好的特征提取方法 . 但输入功能只有2,那么自动编码器的形状将只有2-1-2,这是一个线性提取 .
是否可以设置隐藏节点多于输入数量并制作堆叠自动编码器,例如2-16-8-1-8-16-2节点?
此外,使用自动编码器进行这种数据集成是一个不错的选择吗?如果没有,有没有更好的解决方案?
1 回答
为什么这是线性提取?如果在隐藏和输出图层中使用任何非规则性,则它们之间将产生非线性关系 . 您的编码必须是sigmoid(Ax b) .
如果你真的想让你的网络更复杂,我建议在单个神经元层之前使用多个2个神经元层 . 所以像2 - 2 - 2 - 1 - 2 - 2 - 2节点 . 我没有看到为什么你需要把它变大的原因 .