首页 文章

使用递归神经网络解决时间序列任务

提问于
浏览
0

我有下一个要解决的问题:预测第二天/周的“工作需求” . 我有去年的样本(377个样本,每天1个) . 我的变量是相关的信息(或至少我认为它是相关的):日,周,月,假日,天气条件(温度,下雨,下雪),订阅量(13个变量)我从一开始就提取了所有样本的需求直到今天我得到了:

enter image description here

如果我在一周(星期一,星期二,......)分割这个需求,我得到:
enter image description here

enter image description here

enter image description here

enter image description here

enter image description here

enter image description here

enter image description here

我认为这是一个“时间序列”问题所以我试图用神经网络解决它,特别是使用递归神经网络 . 我的问题是下一个:

1)这真的是一个“时间序列”问题吗?

2)用NN解决这个问题是不是很好?哪种类型? RNN?

3)如果RNN是最好的,我应该考虑另一个可能是常见的变量而我不考虑它吗?

4)如果神经网络不是最好的方法,哪一个是?

5)我应该尝试培训7个不同的网络(一周中每天一个),还是应该尝试培训1个“大”网络?

6)保留异常值是否可以,或者我应该删除它? (假期出现在外面)

2 回答

  • 1

    1)这真的是一个“时间序列”问题吗?

    通过definition,时间序列是按时间顺序索引的一系列数据点 . 你的问题很完美 . 所以,是的,这是一个时间序列问题 .

    2)用NN解决这个问题是不是很好?哪种类型? RNN?

    RNN肯定是这个问题的候选者:RNN擅长捕获系列数据中的类似模式,例如,从语料库中的大量句子学习语言规则 . 您的第一个图表清楚地表明在连续时间步长点之间存在依赖关系 .

    3)如果RNN是最好的,我应该考虑另一个可能很常见的变量,我不考虑它吗?

    这个问题没有普遍的答案 . 深度网络可以从输入的网络中学习新功能(它被称为feature extraction),但也可能无法实现,并且您必须准备它们 .

    4)如果神经网络不是最好的方法,哪一个是?

    再一次,这个问题太宽泛了 . 没有一种最好的方法 . 那么's why I'小心这里的配方:RNN是一个很好的候选人,换句话说,我看不出任何立即尝试的问题 .

    有关于时间序列分析的书籍,统计库包括自动回归,自相关,季节性等 . 讨论那些完全超出StackOverflow的范围 . 如果您建议您在CrossValidated询问 .

    5)我应该尝试训练7个不同的网络(一周中每天一个),还是应该尝试训练1个“大”网络?

    如果不同日期之间的分布明显多样化,您可以这样做 . 坦率地说,我在上面的图表中没有注意到,但是需要调查原始数据来回答这个问题 .

    6)是否可以保留异常值或者我应该删除它? (假期出现在外面)

    一般来说,神经网络不善于预测异常值,因为这里没有模式 . 但是你的第一张图表并没有显示出明显的异常值,所以这是一个与它合作的论据,而不是每个工作日的图表 .

  • 0
    • 不能说 . 似乎是 . 2,4是的,RNN用于时间序列预测 .

    • 不确定按日拆分 . 但可能你有理由这样做 .

    • 我想,培训7个不同的网络要比一个网络困难得多 .

    • 删除它们并替换为最近点的verage . 在RNN工作的所有任务都很难解决异常问题 . 因为缩放(但是如果你不删除它们,可能会有帮助,但RobustScaler可能会有所帮助) .

相关问题