Keras自定义丢失函数dtype错误-Java 学习之路

我有一个NN有两个相同的CNN（类似于Siamese网络），然后合并输出，并打算在合并输出上应用自定义丢失函数，如下所示：

-----------------        -----------------
     |    input_a    |        |    input_b    |
     -----------------        -----------------
     | base_network  |        | base_network  |
     ------------------------------------------
     |           processed_a_b                |
     ------------------------------------------

在我的自定义丢失函数中，我需要将y垂直分成两部分，然后在每个部分上应用分类交叉熵损失 . 但是，我不断从我的损失函数中得到dtype错误，例如：

ValueError Traceback（最近一次调用last）in（）----> 1 model.compile（loss = categorical_crossentropy_loss，optimizer = RMSprop（））/usr/local/lib/python3.5/dist-packages/keras/engine编译中的/training.py（self，optimizer，loss，metrics，loss_weights，sample_weight_mode，** kwargs）909 loss_weight = loss_weights_list [i] 910 output_loss = weighted_loss（y_true，y_pred， - > 911 sample_weight，mask）912 if len （self.outputs）> 1：913 self.metrics_tensors.append（output_loss）/usr/local/lib/python3.5/dist-packages/keras/engine/training.py in weighted（y_true，y_pred，weights，mask） 451＃如果权重不是，则应用样本权重452无： - > 453 score_array * =权重454 score_array / = K.mean（K.cast（K.not_equal（weights，0），K.floatx（）））455 return K.mean（score_array）/usr/local/lib/python3.5/dist-packages/tensorflow/python/ops/math_ops.py in binary_op_wrapper（x，y）827 if if not isinstance（y，sparse_tensor.SparseTensor）：828尝试： - > 829 y = ops.convert_to_tensor（y，dtype = x.dtype.base_dtype，nam e =“y”）830除了TypeError：831＃如果RHS不是张量，它可能是张量识别对象/usr/local/lib/python3.5/dist-packages/tensorflow/python/framework/ops . py in convert_to_tensor（value，dtype，name，preferred_dtype）674 name = name，675 preferred_dtype = preferred_dtype， - > 676 as_ref = False）677 678 /usr/local/lib/python3.5/dist-packages/tensorflow/python internal_convert_to_tensor中的/framework/ops.py（value，dtype，name，as_ref，preferred_dtype）739 740如果ret为None： - > 741 ret = conversion_func（value，dtype = dtype，name = name，as_ref = as_ref）742 743如果ret未实现：_TensorTensorConversionFunction中的/usr/local/lib/python3.5/dist-packages/tensorflow/python/framework/ops.py（t，dtype，name，as_ref）612引发ValueError（613“请求张量转换dtype ％s为Tensor与dtype％s：％r“ - > 614％（dtype.name，t.dtype.name，str（t）））615 return t 616 ValueError：张量转换请求dtype float64为Tensor与dtype float32 ：'Tensor（“processed_a_b_sample_w eights_1：0“，shape =（？，），dtype = float32）'

这是一个重现错误的MWE：

import tensorflow as tf
from keras import backend as K
from keras.layers import Input, Dense, merge, Dropout
from keras.models import Model, Sequential
from keras.optimizers import RMSprop
import numpy as np

# define the inputs
input_dim = 10
input_a = Input(shape=(input_dim,), name='input_a')
input_b = Input(shape=(input_dim,), name='input_b')
# define base_network
n_class = 4
base_network = Sequential(name='base_network')
base_network.add(Dense(8, input_shape=(input_dim,), activation='relu'))
base_network.add(Dropout(0.1))
base_network.add(Dense(n_class, activation='relu'))
processed_a = base_network(input_a)
processed_b = base_network(input_b)
# merge left and right sections
processed_a_b = merge([processed_a, processed_b], mode='concat', concat_axis=1, name='processed_a_b')
# create the model
model = Model(inputs=[input_a, input_b], outputs=processed_a_b)

# custom loss function
def categorical_crossentropy_loss(y_true, y_pred):
    # break (un-merge) y_true and y_pred into two pieces
    y_true_a, y_true_b = tf.split(value=y_true, num_or_size_splits=2, axis=1)
    y_pred_a, y_pred_b = tf.split(value=y_pred, num_or_size_splits=2, axis=1)
    loss = K.categorical_crossentropy(output=y_pred_a, target=y_true_a) + K.categorical_crossentropy(output=y_pred_b, target=y_true_b) 
    return K.mean(loss)

# compile the model
model.compile(loss=categorical_crossentropy_loss, optimizer=RMSprop())

1 回答

0
如您的错误所示，您正在处理 float32 数据，并且它期望 float64 . 有必要将错误跟踪到其特定的行，以确定要纠正的张量，并能够更好地帮助您 .

但是，它似乎与 K.mean() 方法有关，但 ValueError 也可以由 K.categorical_crossentropy() 方法生成 . 因此问题可能在于您的张量 loss ， y_pred 或两者 y_true . 鉴于这些情况，我看到你可以尝试解决问题的两件事：
- 你可以cast你的张量（假设它是 loss ）到所需的（float64）类型，如下所示：
```
from keras import backend as K
new_tensor = K.cast(loss, dtype='float64')
```
- 您可以通过将参数 dtype 传递给 Input() 调用（如these示例中所示），将开头的输入声明为float64类型，如下所示：
```
input_a = Input(shape=(input_dim,), name='input_a', dtype='float64')
```
回复于 2024-05-06T12:18:47+08:00

Keras自定义丢失函数dtype错误

1 回答

相关问题