使用张量流中的n / a标签停止渐变-Java 学习之路

我在以下场景中是'm implementing a Convolutional Neural Network in Tensorflow with python. I' m：我有一个标签张量 y （批量标签），如下所示：

y =   [[0,1,0]
       [0,0,1]
       [1,0,0]]

其中每一行都是一个 one-hot 向量，表示与对应示例相关的标签 . 现在在训练中，我希望使用该标签停止 loss gradient （设置为0）（第三个）：

[1,0,0]

它表示不适用标签，而是计算批次中其他示例的丢失 . 对于我的损失计算，我使用这样的方法：

self.y_loss = kl_divergence(self.pred_y, self.y)

我发现这个function停止了渐变，但是如何有条理地将它应用于批处理元素呢？

1 回答