首页 文章

在我的单个样本的训练数据上过度拟合我的模型

提问于
浏览
3

我试图在我的训练数据上过度拟合我的模型,该训练数据只包含一个样本 . 训练精度为1.00 . 但是,当我预测包含相同单个训练输入样本的测试数据的输出时,结果不准确 . 该模型已经训练了100个时期和损失~1e-4 . 可能的错误来源是什么?

1 回答

  • 4

    正如您的帖子评论中所提到的,如果没有您首先提供更多详细信息,则无法提供具体建议 .

    一般来说,您过度拟合一小批(在您的情况下是一个图像)的方法实质上是提供三个完整性检查,即:

    • backprop正在运行

    • 重量更新正在完成他们的工作

    • 学习率处于正确的数量级

    正如Andrej Karpathy在斯坦福大学CS231n课程第5讲中指出的那样 - "if you can't overfit on a tiny batch size, things are definitely broken" .

    这意味着,根据您的描述,您的实现是不正确的 . 我首先检查上面列出的这三点中的每一点 . 例如,通过选择几个不同的图像或btach大小的5个图像而不是一个图像来以某种方式改变您的测试 . 您也可以修改 predict function ,因为在训练过程中你得到零错误(这样验证?),这肯定会有一些差异 .

相关问题