我很难理解RNN中使用的不同"jargons" . 它们如下: batch_size
, time_steps
, inputs
和 instances
.
让我通过我对每个输入参数的理解,请纠正我在哪里得到一系列数字,我想预测下一个数字 . 数字如下: [1,2,3,4,5,....,100]
time_steps
:此参数表示RNN在预测未来之前将过去的距离 . 为简单起见,我想提前预测1个数字 . 我想在过去看到10个数字之后做 . 所以,在这种情况下, time_steps
将是10 .
inputs
:这些是每个 time_steps
的值 . 在第 time_step
( t
) inputs
是 t0
: [1]
t1
: [2]
.
.
.
t10
:[10]`
batch_size
:这有助于RNN模型的有效计算 . 假设我的 batch_size
是2.在这种情况下,在 time_step
2,RNN输入将是
t0: [1]
t0: [11]
那么 instances
的用法是什么?例如 . 在这个post中,已经使用了实例 . 并且有多种情况使用 instances
. 是否意味着每个循环超过批次?例如 . 有5个批次,每个大小2.然后将有5个 instances
.
请帮我纠正我的理解 .
谢谢!
2 回答
好吧朋友,你很好地学习了这些概念 . 我很难正确地学习这些 . 你所知道的一切似乎都是有序的,就像“实例”一样 . 它们基本上是一组数据 . 在深度学习社区中没有固定的“实例”使用期限 . 有些人用它来引用不同的数据集或批量数据 . 我很少在论文中听到它 .
batch_size
通常,批量大小表示从实验数据集构建的小批量的大小 . 由于在深度学习中,我们需要进行大量计算,如果我们考虑小批量操作会更好,因为GPU的使用将是值得的 .
time_steps
由于RNN采用顺序输入,因此输入序列中每个元素的索引可以称为该序列的时间步长 . 例如,如果
[1,2,3,4,5,....,100]
是序列,则序列中每个元素的索引是时间步长 .inputs
术语
inputs
具有更广泛的含义,因此我不确定我的定义是否正确 . 根据我的理解,对RNN的输入是指在每个时间步骤提供给RNN的个人输入 . 例如,在[1,2,3,4,5,....,100]
中,每个元素是特定时间步长的RNN输入 .但是以抽象的方式,如果有人问,你的深层神经模型的输入是什么?你可以说,它是英文句子或图像或音频剪辑或视频等 . 简而言之,术语
inputs
的含义取决于上下文 .instances
实例中,实例是指数据集中的训练/开发/测试示例 . 例如,序列:
[1,2,3,4,5,....,100]
可以是数据集中的训练实例 .希望这可以帮助!