我正在训练一个Keras模型( tf.keras.models.Sequential
),调用它的方法 fit()
.
由于我启用了急切执行,因此训练时间(相同数量的时期)从20.1s上升到49.4s . 此外,培训似乎不再收敛,因为损失保持在9左右(没有急切的执行,它下降到1),而方法 fit()
甚至没有报告所请求的指标"accuracy" .
对Keras模型的热切执行支持?请注意,我在模型上调用方法 fit()
,而不是使用估算器 .
这里是代码片段,用于声明模型并进行培训 . 使用TF 1.7安装pip3的GPU .
tf.enable_eager_execution()
model = tf.keras.models.Sequential([
tf.keras.layers.InputLayer(input_shape=(11,)) ,
tf.keras.layers.Dense(64, activation='relu') ,
tf.keras.layers.Dense(32, activation='relu'),
tf.keras.layers.Dense(11, activation='softmax')
])
optimizer = tf.train.AdamOptimizer()
# optimizer = 'adam'
model.compile(optimizer=optimizer, loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(x=train_X, y=train_y, epochs=200, batch_size=64, verbose=2)
更新:在Tensorflow GITHUB上提交了#18642号问题 .
2 回答
以下是来自Tensorflow网站的报价here
这意味着使用Eager执行允许keras层和后续模型 . 至于你的时间安排,链接还提到了如何使用急切停止构建图表 .
考虑到您拥有的DENSE层数,这可能会使您的模型更难运行 . 有人可能会纠正我,因为我以前没有做过很多关于DENSE层的工作,或者说我已经很久了 . 如果这不起作用,那么我会调查你的损失函数 . This answer may help if that becomes a problem .
其他一切看起来都不错 . 希望这可以帮助 .
EDIT
好的,我看到你说的是命运 . 是的,第一个链接使用顺序模型,但梯度磁带渐变得体 . 深入阅读热切的教程表明他们也只使用Gradient磁带 . 以下是教程中关于培训的内容:
所以也许现在只有Gradient磁带和估算器方法是你应该用的渴望 .
我在tensorflow上报道的问题得到了这样的答案:
请参阅GITHUB上针对Tensorflow的问题#18642 .
基于此,我理解一旦错误得到修复,Keras模型的方法将受到热切执行的支持 .