我正在尝试转换Seq2Seq model我在本地运行使用EstimatorExperiment来使用Tensorflow分布式功能 . 基本功能和目标设置如下:

for every input and response (translation or prompt and response):
  raw input -> tokenized input -> tokenized response -> raw response

注意:

  • 特征将具有形状[桶数] [数字输入@桶大小] [输入桶的大小]

  • 目标将具有[桶数] [数量响应@桶大小] [响应桶的大小]

几个问题:

  • 一般来说,推荐使用Experiment类和Estimator接口来处理这种模型吗?

  • 我可以使用实验设置培训批量大小吗?似乎 train_stepseval_steps 与训练和评估的迭代有关 . 是否有其他选项可以为这些步骤设置批量大小,还是实验在内部/自动计算批量大小?

  • 我假设实验 train_input_fneval_input_fn 可以是任何返回特征字典和目标张量的input_fn . 在上面的例子中,我真的只需要一个特征张量和一个目标张量,因为我创建一个自定义Estimator,只要我的Estimator的 model_fn 期望这些形状并且可以正确地从它们返回损失,它可以是任何形状 . 它是否正确?