我正在尝试转换Seq2Seq model我在本地运行使用Estimator和Experiment来使用Tensorflow分布式功能 . 基本功能和目标设置如下:
for every input and response (translation or prompt and response):
raw input -> tokenized input -> tokenized response -> raw response
注意:
-
特征将具有形状[桶数] [数字输入@桶大小] [输入桶的大小]
-
目标将具有[桶数] [数量响应@桶大小] [响应桶的大小]
几个问题:
-
一般来说,推荐使用Experiment类和Estimator接口来处理这种模型吗?
-
我可以使用实验设置培训批量大小吗?似乎
train_steps
和eval_steps
与训练和评估的迭代有关 . 是否有其他选项可以为这些步骤设置批量大小,还是实验在内部/自动计算批量大小? -
我假设实验
train_input_fn
和eval_input_fn
可以是任何返回特征字典和目标张量的input_fn . 在上面的例子中,我真的只需要一个特征张量和一个目标张量,因为我创建一个自定义Estimator,只要我的Estimator的model_fn
期望这些形状并且可以正确地从它们返回损失,它可以是任何形状 . 它是否正确?