正如 Headers 所示,我有一个时间序列数据集,并且有很多缺失的数据 . 处理LSTM模型的最佳方法是什么?
为了进一步详细说明,我有大约五个数据源来创建数据集,其中一些不允许我获取历史数据,因此我对该源中的功能缺少相当多的内容 . 我可以填写一些使用最近观察到的样本,但在大多数情况下,这是不可能的 .
我看到的一些建议是:
-
隐马尔可夫模型
-
期望最大化
-
使用神经网络预测缺失值
但就我而言,我觉得我将失去大量的数据完整性 . 通常如何处理/在LSTM模型中调整此方法的最佳方法是什么?
我正在使用Python / Keras / TensorFlow .
1 回答
也许masking在你的模型的顶层可以帮助 .