我正在使用Keras制作CNN,我想用 plot_model()
可视化模型 .
当我看到 Conv2d
层的形状时,有一件事我无法弄清楚 .
假设我的 Conv2d
图层的内核大小为 [8 x 8]
,stride为 [4 by 4]
,填充为 'same'
,我想要16个要素图 .
此图层的输入形状为 [None, 3, 160, 320]
,输出为 [None,1,40,16]
.
“没有”是样本,但是1和40是什么?我猜16是特色 Map 的数量?
既然我实现了 padding = 'same'
,那么't the image size out have the same width and height as input, or isn' t这同样的事情呢?
谢谢!
1 回答
好吧,因为你正在使用“步幅”,你将永远不会有相同的形状 .
您的卷积滤镜(可以看作是滑动窗口)在其滑动中跳跃四个像素 .
结果,您将最终形状除以4(并向上舍入) .
3/4向上舍入= 1
160/4 = 40
16确实是特征图的数量 .