Torch或Tensorflow中的通用递归神经网络-Java 学习之路

我正在尝试实现this recurrent neural network（这是一个语音活动检测器）：

rnn

请注意，那些蓝色圆圈是单个神经元 - 它们不代表许多神经元 . 这是一个非常小的网络 . 还有一些额外的细节，比如S的意思是什么，以及某些层是二次的，但这对于这个问题并不重要 .

我使用Microsoft的_2545656这样实现它（未经测试！）：

# For the layers with diagonal connections.
QuadraticWithDiagonal(X, Xdim, Ydim)
{
    OldX = PastValue(Xdim, 1, X)
    OldY = PastValue(Ydim, 1, Y)

    Wqaa = LearnableParameter(Ydim, Xdim)
    Wqbb = LearnableParameter(Ydim, Xdim)
    Wqab = LearnableParameter(Ydim, Xdim)
    Wla = LearnableParameter(Ydim, Xdim)
    Wlb = LearnableParameter(Ydim, Xdim)
    Wlc = LearnableParameter(Ydim, Xdim)
    Wb = LearnableParameter(Ydim)

    XSquared = ElementTimes(X, X)
    OldXSquared = ElementTimes(OldX, OldX)
    CrossXSquared = ElementTimes(X, OldX)

    T1 = Times(Wqaa, XSquared)
    T2 = Times(Wqbb, OldXSquared)
    T3 = Times(Wqab, CrossXSquared)

    T4 = Times(Wla, X)
    T5 = Times(Wlb, OldX)
    T6 = Times(Wlc, OldY)

    Y = Plus(T1, T2, T3, T4, T5, T6, Wb)
}

# For the layers without diagonal connections.
QuadraticWithoutDiagonal(X, Xdim, Ydim)
{
    OldY = PastValue(Ydim, 1, Y)

    Wqaa = LearnableParameter(Ydim, Xdim)
    Wla = LearnableParameter(Ydim, Xdim)
    Wlc = LearnableParameter(Ydim, Xdim)
    Wb = LearnableParameter(Ydim)

    XSquared = ElementTimes(X, X)

    T1 = Times(Wqaa, XSquared)  
    T4 = Times(Wla, X)
    T6 = Times(Wlc, OldY)

    Y = Plus(T1, T4, T6, Wb)
}

# The actual network.

# 13x1 input PLP.
I = InputValue(13, 1, tag="feature")
# Hidden layers
H0 = QuadraticWithDiagonal(I, 13, 3)
H1 = QuadraticWithDiagonal(H0, 3, 3)
# 1x1 Pre-output
P = Tanh(QuadraticWithoutDiagonal(H1, 3, 1))
# 5x1 Delay taps
D = QuadraticWithoutDiagonal(P, 1, 5)
# 1x1 Output
O = Tanh(QuadraticWithoutDiagonal(D, 5, 1))

PastValue() 函数从前一个时间步获取图层的值 . 这使得实现像这样的不寻常的RNN变得非常容易 .

不幸的是，虽然CNTK的网络描述语言非常棒，但我发现你不能编写数据输入，训练和评估步骤的脚本而非限制性 . 所以我正在考虑在Torch或Tensorflow中实现相同的网络 .

不幸的是，我似乎相当于 PastValue() ，并且所有不仅使用预制LSTM层的示例都是完全不透明的 .

任何人都可以告诉我如何在Torch或Tensorflow（或两者兼有！）中实现这样的网络？

1 回答

2

我是微软员工 . CNTK目前正在组件化，其关键的高级构建块将以C / Python库的形式提供 . 目标是通过实现可扩展性，与外部代码的互操作性和可组合性来提高工具包使用的灵活性 . 这些库组件组成并互操作，以形成深度学习工作负载所需的核心培训和评估功能 . 该库还允许在外部实现这些组件中的一个或多个，从而可以使用CNTK的库组件组成外部C / Python代码和库 . 预计到8月底 .

回复于 2024-04-19T12:19:05+08:00

Torch或Tensorflow中的通用递归神经网络

1 回答

相关问题