CNN准确性冻结-Java 学习之路

所以我正在训练CNN网络来检测输入图像中的某些特征 . 结构如下：

输入图像 - > Conv2D - > Relu - >密集 - > Softmax - >结果

该数据集包含3个类别中的180个黑白图像，每个类别只有60个图像 .

我的问题是验证准确性和训练准确性仅在大约6-7个时期后没有变化，如下图所示：

enter image description here

我尝试使用谷歌搜索解决方案但到目前为止没有结果 . 起初我认为我的模型已经过度装配，因为它不再“学习”而且训练损失不断减少，而验证损失则没有 . 因此我尝试添加学习率衰减，Nesterov动量，增加批量大小以减少过度拟合，但它们没有改变太多（好吧，总体准确度确实从0.90提高到0.92），而且我的准确性正好停留在1.00,0.88每次0.87（之前是1.00,0.85和0.85） .

我想要识别的功能非常简单，我需要在控制循环中使用结果，所以我想要一个轻量级模型，如果可能的话，精度至少为95％ . 你们对于应该做什么或者至少是改进这个模型的研究方向有什么想法吗？

1 回答

3

你的模型过于贴合 . 训练损失接近于零（训练精度已达到100％）;然而，验证损失远远高于培训损失 . 理想的模型会将培训和验证损失放在一起 . 您尚未提供任何代码;所以假设你的模型没有错，我会建议正规化技术，如丢失，重量衰减（L2）和批量标准化 .

回复于 2024-04-29T06:57:48+08:00

CNN准确性冻结

1 回答

相关问题