我使用分布式tensorflow从HDFS路径读取数据文件来进行培训 .

每个工作程序将运行 tf.train.batch 以从同一组文件中检索数据批处理 . 我尝试多次重新运行程序 . 对于每次运行,当有文件要读取时,不一致的工作人员子集将在训练开始时返回 OutOfRangeError . 它将抛出:

FIFOQueue '_0_batch_csv/fifo_queue' is closed and has insufficient elements (requested 2048, current size 0)

是否将HDFS路径中的内容排队队列的线程太慢了?