快速介绍 - 我正在尝试在tensorflow中构建YOLO模型 . 我无法找到用于训练YOLO对象检测和分类模型的y输出的形状 . 假设为了这个例子,预测值的形状是(13,13,2,7),其中有13×13个单元,每个单元有两个猜测,对应7×1的形状 . 这个7x1猜测是(is_obj_in_cell,x_mid,y_mid,width,length,prob_cat,prob_dog) .

就我而言,有两种选择:

1)y的形状是(13,13,7)这似乎是有意义的,因为YOLO损失函数需要评估所有边界框预测的IoU(在这个例子中2个猜测)

2)y的形状是(13,13,2,7),其中y稍微“硬编码”,预测应该与什么类型的边界框相对应(即宽度>长度,长度<=宽度等)尽管这是有道理的,这意味着对边界框预测的任何求和都没有意义,因为y是严格定义的 .

任何人都可以帮我解决这个问题吗?