为什么在损失函数中使用而不是求和?
即是否有任何理由为何这是首选
def mae_loss(y_true, y_pred):
loss = tf.reduce_mean(tf.abs(y_true-y_pred))
return loss
对此
def mae_loss(y_true, y_pred):
loss = tf.reduce_sum(tf.abs(y_true-y_pred))
return loss
在Keras源代码中,还使用了mean变量:
1 回答
我们通常计算损失以与其他人进行比较或尽可能地减少损失 . 如果您只是得到总和而不是均值,结果将根据数据的数量而变化,那么很难找到它是否是本能的 . 这就是为什么我们通常使用'均方误差'或'平均绝对误差'而不是它们的总和 .