首页 文章

处理RNN / LSTM中缺失的数据(时间序列)

提问于
浏览
3

正如 Headers 所示,我有一个时间序列数据集,并且有很多缺失的数据 . 处理LSTM模型的最佳方法是什么?

为了进一步详细说明,我有大约五个数据源来创建数据集,其中一些不允许我获取历史数据,因此我对该源中的功能缺少相当多的内容 . 我可以填写一些使用最近观察到的样本,但在大多数情况下,这是不可能的 .

我看到的一些建议是:

  • 隐马尔可夫模型

  • 期望最大化

  • 使用神经网络预测缺失值

但就我而言,我觉得我将失去大量的数据完整性 . 通常如何处理/在LSTM模型中调整此方法的最佳方法是什么?

我正在使用Python / Keras / TensorFlow .

1 回答

  • 3

    也许masking在你的模型的顶层可以帮助 .

    对于输入张量中的每个时间步长(张量中的维#1),如果该时间步长的输入张量中的所有值都等于mask_value,则所有下游层中的时间步长将被屏蔽(跳过)(只要它们为支持掩蔽) .

相关问题