我目前正在尝试进行深度学习,并且在理解CNN方面存在一个小问题 .
根据CS231n,计算conv的输出大小的通用公式 . layer是 W'=(W−F+2P)/S+1
,其中 W
是输入大小, F
是接收字段, P
是填充, S
是步幅 . 到目前为止这么好,我完全可以理解这个公式 .
但那时就是TensorFlow tutorial . 根据教程,第一个卷积层的输出大小为28x28x32 . 为什么不(28-5)/ 1 1 = 24→24x24x32,这样第一个汇集层会将它减少到12x12x32?我在这做错了什么?
1 回答
这里对于conv层,默认使用
SAME
填充 .P=floor(F/2)
forSAME
padding . 所以(28- 5 + 2*2)/1 +1 = 28