如何在GAN培训中使用TensorFlow Dataset API？-Java 学习之路

我正在训练GAN模型 . 为了加载数据集，我使用的是TensorFlow的数据集API .

# train_dataset has image and label. z_train dataset has noise (z).
train_dataset = tf.data.TFRecordDataset(train_file)
z_train = tf.data.Dataset.from_tensor_slices(tf.random_uniform([total_training_samples, seq_length,  z_dim],
                                                                 minval=0, maxval=1, dtype=tf.float32))

train_dataset = tf.data.Dataset.zip((train_dataset, z_train))

创建迭代器：

iter = tf.data.Iterator.from_structure(train_dataset.output_types, train_dataset.output_shapes)

使用迭代器：

(img, label), z = iter.get_next()
train_init_op = iter.make_initializer(train_dataset)

在 Session 期间培训GAN：
首先训练判别者：

_, disc_loss = sess.run([disc_optim, disc_loss])

然后训练发电机：

_, gen_loss = sess.run([gen_optim, gen_loss])

这是捕获 . 因为，我在鉴别器和生成器图中使用 label 作为条件（CGAN），使用两个sess.run在同一批次运行期间生成两组不同的 label 批 .

for epoch in range(num_of_epochs):
    sess.run([tf.global_variables_initializer(), train_init_op.initializer])
    for batch in range(num_of_batches):
        _, disc_loss = sess.run([disc_optim, disc_loss])
        _, gen_loss = sess.run([gen_optim, gen_loss])

因为，我必须在生成器_596157会话运行中提供相同批次的 label ，如何防止数据集API在批处理的同一循环中生成两个不同的批处理？
注意：我使用的是TensorFlow v1.9
提前致谢 .

1 回答

您可以为同一数据集创建2个迭代器 . 如果需要对数据集进行混洗，您甚至可以通过将种子指定为张量来实现 . 见下面的例子 .

import tensorflow as tf

seed_ts = tf.placeholder(tf.int64)
ds = tf.data.Dataset.from_tensor_slices([1,2,3,4,5]).shuffle(5, seed=seed_ts, reshuffle_each_iteration=True)
it1 = ds.make_initializable_iterator()
it2 = ds.make_initializable_iterator()

input1 = it1.get_next()
input2 = it2.get_next()

with tf.Session() as sess:
    for ep in range(10):
        sess.run(it1.initializer, feed_dict={seed_ts: ep})
        sess.run(it2.initializer, feed_dict={seed_ts: ep})

        print("Epoch" + str(ep))
        for i in range(5):
            x = sess.run(input1)
            y = sess.run(input2)
            print([x, y])

回复于 2024-05-04T11:31:34+08:00

如何在GAN培训中使用TensorFlow Dataset API？

1 回答

相关问题