Description
给定具有10个序列的数据集 - 序列对应于股票 Value 记录的一天 - 其中每个序列构成50个样本记录的库存值,从早晨或上午9:05开始以5分钟的间隔分开 . 但是,有一个额外的记录(第51个样本)仅在训练集中可用,该训练集是在50个样本记录中的最后记录样本的2小时后,而不是5分钟 . 对于测试集,需要预测第51个样本,其中还给出了前50个样本 .
我正在使用 pybrain
递归神经网络来解决将序列组合在一起的问题,并且每个样本 x_i
的标签(或通常称为目标 y
)是下一个时间步骤的样本 x_(i+1)
- 时间序列预测中的典型公式 .
Example
A sequence for one day is something like:
Signal id Time value
1 - 9:05 - 23
2 - 9:10 - 31
3 - 9:15 - 24
... - ... - ...
50 - 13:15 - 15
Below is the 2 hour later label 'target' given for the training set
and is required to be predicted for the testing set
51 - 15:15 - 11
Question
既然我的递归神经网络(RNN)已经训练了这10个序列,如果它面对另一个序列,我将如何使用 RNN
来预测序列中最后一个样本之后的股票 Value 2 hours
?
请注意,对于每个训练序列我也有"2 hours later than the last sample stock values"但我不确定如何将其纳入训练 RNN
,因为它期望样本之间的时间间隔相同 . 谢谢!
1 回答
我希望我能帮助你
经常性网络结构
一些提示
选择您的经常性网络
更成熟的长时间短时记忆(LSTM)神经网络非常适合这种任务 . LSTM能够检测股票 Value "graph"中的常见"shapes"和"variations",并且有很多研究试图证明这些形状实际上发生在现实生活中! See this link for an example .
准确度
如果您希望网络达到更高的准确度,我建议您还为网络提供上一年(在完全相同的日期)的库存值,以便输入数量从50增加到100倍 . 虽然网络可能如果你的数据集得到很好的优化,就永远无法预测未来不可预测的行为;)