我如何通过在线培训训练(适合)我的模型只有一个问题:我的网络必须等待y . 我有流动的场景:

(我的网络输出)--->(openAI gym)--->(从健身房模拟计算损失)--->(反向传播) .

我知道fit_generate但你必须在输入的同时提供输出,但在这里我必须等待并进行Backpropagation .