Wasserstein GAN评论家培养模糊性-Java 学习之路

我正在运行一个基于DCGAN的GAN，正在试验WGAN，但对如何训练WGAN感到有些困惑 .

在官方Wasserstein GAN PyTorch implementation中，据说每个发电机培训的鉴别人员/评论员都经过培训 Diters （通常是5次） .

这是否意味着评论家/鉴别者在 Diters 批次或整个数据集 Diters 次？如果我没有弄错的话，官方的实施表明鉴别者/评论家在整个数据集上训练了_596169次，但WGAN的其他实现（在PyTorch和TensorFlow等中）却恰恰相反 .

哪个是对的？ The WGAN paper（至少对我而言），表示它是 Diters 批次 . 整个数据集的训练显然要慢几个数量级 .

提前致谢！

1 回答