为什么在损失函数中使用而不是求和？-Java 学习之路

为什么在损失函数中使用而不是求和？

即是否有任何理由为何这是首选

def mae_loss(y_true, y_pred):
    loss = tf.reduce_mean(tf.abs(y_true-y_pred))
    return loss

对此

def mae_loss(y_true, y_pred):
    loss = tf.reduce_sum(tf.abs(y_true-y_pred))
    return loss

在Keras源代码中，还使用了mean变量：

1 回答

2

我们通常计算损失以与其他人进行比较或尽可能地减少损失 . 如果您只是得到总和而不是均值，结果将根据数据的数量而变化，那么很难找到它是否是本能的 . 这就是为什么我们通常使用'均方误差'或'平均绝对误差'而不是它们的总和 .

回复于 2024-05-13T23:44:56+08:00