我正在尝试在人类行为分类的背景下实现2D RNN(RNN的一个轴上的关节和另一个轴上的时间),并且一直在寻找可以完成工作的Tensorflow中的某些东西 .
我听说 GridLSTMCell
(internally和externally贡献)但无法使用 dynamic_rnn
(接受3-D张量,但我必须提供4-D张量[batchsize,max_time,num_joints,n_features]) .
另外, ndlstm
也是TF库的(有些未知)part,它基本上使用普通的1-D LSTM并转换输出以将其馈送到第二个1-D LSTM . 这也被提倡here但是我不太确定它是否与我需要的想法相同 .
任何帮助,将不胜感激 .
1 回答
我已成功尝试在tensorflow中使用
GridLSTM
和ndlstm
.我不确定如何将4D Tensor转换为3D,因为它被
dynamic_rnn
接受但我想这可能会让你知道如何使用GridLSTM
:显然,
ndlstm
接受形状为(batch_size, height, width, depth)
的4D张量,我有这些测试(一个涉及使用tensorflow的ctc_loss
. 还发现它与conv2d一起使用的example):