我需要计算相对于输入的网络输出的梯度(而不是损耗),但我得到错误 grad can be implicitly created only for scalar outputs . 我在this paper中描述了'm trying to reproduce what',我需要我提到的渐变来执行第7步
enter image description here

这就是我想做的事情:

out = netD(input).view(-1)
out.backward(retain_graph=True)
grad = input.grad