首页 文章

简单的回归神经网络输入形状

提问于
浏览
6

我正在尝试使用keras编写一个非常简单的RNN示例,但结果并不像预期的那样 .

我的X_train是一个长度为6000的重复列表,如: 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, ...

我将其格式化为: (6000, 1, 1)

我的y_train是一个长度为6000的重复列表,如: 1, 0.8, 0.6, 0, 0, 0, 1, 0.8, 0.6, 0, ...

我将其格式化为: (6000, 1)

根据我的理解,递归神经网络应该学会正确地预测0.8和0.6,因为它可以记住两个步前的X_train中的1 .

我的模特:

model=Sequential()
model.add(SimpleRNN(input_dim=1, output_dim=50))
model.add(Dense(output_dim=1, activation = "sigmoid"))
model.compile(loss="mse", optimizer="rmsprop")
model.fit(X_train, y_train, nb_epoch=10, batch_size=32)

该模型可以成功训练,损失最小〜0.1015但结果不如预期 .

test case ---------------------------------------------  model result -------------expected result 

model.predict(np.array([[[1]]])) --------------------0.9825--------------------1

model.predict(np.array([[[1],[0]]])) ----------------0.2081--------------------0.8

model.predict(np.array([[[1],[0],[0]]])) ------------0.2778 -------------------0.6

model.predict(np.array([[[1],[0],[0],[0]]]))---------0.3186--------------------0

我在这里误解了什么?

1 回答

  • 14

    输入格式应该是三维的:三个组件代表样本大小,时间步数和输出维度

    一旦适当地重新格式化,RNN确实能够很好地预测目标序列 .

    np.random.seed(1337)
    
    sample_size = 256
    x_seed = [1, 0, 0, 0, 0, 0]
    y_seed = [1, 0.8, 0.6, 0, 0, 0]
    
    x_train = np.array([[x_seed] * sample_size]).reshape(sample_size,len(x_seed),1)
    y_train = np.array([[y_seed]*sample_size]).reshape(sample_size,len(y_seed),1)
    
    model=Sequential()
    model.add(SimpleRNN(input_dim  =  1, output_dim = 50, return_sequences = True))
    model.add(TimeDistributed(Dense(output_dim = 1, activation  =  "sigmoid")))
    model.compile(loss = "mse", optimizer = "rmsprop")
    model.fit(x_train, y_train, nb_epoch = 10, batch_size = 32)
    
    print(model.predict(np.array([[[1],[0],[0],[0],[0],[0]]])))
    #[[[ 0.87810659]
    #[ 0.80646527]
    #[ 0.61600274]
    #[ 0.01652312]
    #[ 0.00930419]
    #[ 0.01328572]]]
    

相关问题