我试图使用opencv 4 android sdk检测矩形文档 . 首先,我试图通过查找轮廓来检测它,但它不适用于多色文档 . 您可以查看此链接以获得更好的主意:detecting multi color document with OpenCV4Android
我研究了很多,发现它可以使用houghline transform完成 . 所以我按照以下方式检测文档:
原始图像 - > cvtColor - > GaussianBlur过滤器 - >扩大它以锐化边缘 - >应用分水岭图像分割算法 - >动态otsu阈值的canny边缘检测 - >然后应用hough线变换
我为霍夫线变换所做的是:
Imgproc.HoughLinesP(watershedMat, lines, 1, Math.PI / 180, 50, 100, 50);
List<Line> horizontals = new ArrayList<>();
List<Line> verticals = new ArrayList<>();
for (int x = 0; x < lines.rows(); x++)
{
double[] vec = lines.get(x, 0);
double x1 = vec[0],
y1 = vec[1],
x2 = vec[2],
y2 = vec[3];
Point start = new Point(x1, y1);
Point end = new Point(x2, y2);
Line line = new Line(start, end);
if (Math.abs(x1 - x2) > Math.abs(y1-y2)) {
horizontals.add(line);
} else if (Math.abs(x2 - x1) < Math.abs(y2 - y1)){
verticals.add(line);
}
}
从上面的水平和垂直线列表,我发现如下交叉点:
protected Point computeIntersection (Line l1, Line l2) {
double x1 = l1._p1.x, x2= l1._p2.x, y1 = l1._p1.y, y2 = l1._p2.y;
double x3 = l2._p1.x, x4 = l2._p2.x, y3 = l2._p1.y, y4 = l2._p2.y;
double d = (x1 - x2) * (y3 - y4) - (y1 - y2) * (x3 - x4);
// double angle = angleBetween2Lines(l1,l2);
Log.e("houghline","angle between 2 lines = "+angle);
Point pt = new Point();
pt.x = ((x1 * y2 - y1 * x2) * (x3 - x4) - (x1 - x2) * (x3 * y4 - y3 * x4)) / d;
pt.y = ((x1 * y2 - y1 * x2) * (y3 - y4) - (y1 - y2) * (x3 * y4 - y3 * x4)) / d;
return pt;
}
从那四个交叉点我画线 . 所以,我能够通过它检测文件 . 见下图:
但是,当其他对象与文档相关时,它也会尝试检测它们 . 我要往下行,从左到右,找到最大矩形的交点 . 我有以下问题:
正如您在上面的图像中看到的那样,当屏幕上出现其他对象时,它也会检测到它 . 如何只检测文件?并忽略其他对象?这是我的原始图像:
任何帮助将非常感谢!!提前致谢
1 回答
一般信息
我在Windows 10上使用的是OpenCV 3.2.0,但是所有提到的功能都应该在2.4和/或Android中提供 .
我调整了图像大小以获得更好的可视化效果 . 这不会影响当前解决问题的方法,但是如果我们使用某种边缘检测,我们绝对应该使用原始图像大小 .
提供的当前解决方案使用了许多自定义功能(LAB颜色检测,轮廓尺寸分析等),这里不能说明 . 如果您需要特定领域的帮助,您当然可以在评论中寻求帮助 .
一般观察问题
您之前的方法无效的原因有多种 . 在我们得到解决方案之前,这里有一些需要考虑的观察:
与背景相比,您有一个包含更暗和更亮元素的对象 .
你有一个对象,它包含关于亮度和颜色的相当不同的部分,以及一般的同质性 . 事实上,该对象被一个看起来很像背景的部分拆分 .
您的背景对象与一般背景明显不同(例如右上角的黑色对象) .
通常从略微倾斜的视角捕获对象 . 这导致否则为矩形的对象的透视变换 .
解决方案
考虑到上述提到的意见,我不建议 foreground and/or background color detection and classification via LAB or HSV color space . 应使用最突出颜色的样本图像对相应区域进行分类 . 例如 . 对于前景,黑暗和明亮的红色以及书的金/黄色 . 背景由相当均匀的浅灰色组成,可用于检测 . 潜在算法:
根据LAB颜色空间检测前景和背景并对其进行分类 . 使用合理的颜色距离阈值(对我来说,在LAB空间中工作的大约8-10% - AB空间可能工作5-7%) . 如果由于亮度变化引起的颜色变化成为问题,那么切换到与亮度无关的方法(例如,只是juse AB组件并忽略L组件)
从前景检测中排除部分背景(分类中可能存在一些重叠,因此此顺序可防止混淆) .
在剩余的二进制图像上,应用轮廓搜索并丢弃面积太小的轮廓 .
剩下的轮廓构成了这本书 . 创建一个可用作对象ROI的凸包 .
好处:
非常准确
适用于多种场景(更改背景,不同照明 - 如果使用正确的色彩空间)
缺点:
难以为初学者实施(了解LAB或HSV,颜色距离,支持多色分类等)
颜色检测完全取决于背景和前景 . 这意味着如果这本书改变了,例如蓝色,必须调整样本图像 .
如果书的所有顶部,底部或侧面看起来像背景,则此方法不起作用 . 如果是这种情况,本书的这些部分将被归类为背景 .
一般解决方案的难度
有一些原因可以解释为什么目前的方法虽然很先进,但还不足以满足一般应用(不同的书籍,不同的背景等) .
如果你想要一个通用的系统,可以自动检测不同背景下的不同书籍,你就会遇到麻烦 . 这达到了难以解决的难度 . 它让我想起了车牌的检测:不同的照明,噪音,被污染的物体,强烈变化的背景,不良的对比度等 . 即使你管理这个,这里有一个问题:这样的系统只适用于特定类型车牌 . 这同样适用于您的书籍 .
测试
由于您发布了一个非常相似的问题(detecting multi color document with OpenCV4Android),我冒昧地使用在那里发布的图像以及您在此处提供的图像 . 由于其中一个图像仅提供红色ROI,我使用我的Photoshop技能级别> 9000来删除红色ROI :) .
Sample images for background classification
Sample images for foreground classification
Images
Background classification
Foreground classification
Detected objects
更新
Quick LAB速成课程
由于色彩空间理论非常广泛,您应该首先阅读一些基础知识和要点 . 我的快速搜索发现这个网站很好地解释了一些重点:http://www.learnopencv.com/color-spaces-in-opencv-cpp-python/ - 我们将使用OpenCV的float变体,因为它是最简单的使用(未改变的LAB范围,没有缩放,没有shfiting等) . - LAB值范围:L *轴(亮度)范围从0到100 a *和b *(颜色属性)轴范围从-128到127来源和参考:What are the ranges of coordinates in the CIELAB color space? http://www.colourphil.co.uk/lab_lch_colour_space.shtml
颜色距离
https://en.wikipedia.org/wiki/Color_difference
基本上,我们使用两种颜色之间的欧几里德距离 . 当然,我们可以省略我们比较的两种颜色的组件,例如亮度分量(L) .
为了获得直观的颜色距离度量,我们可以简单地将颜色距离标准化为0.0到1.0之间的范围 . 这样我们可以将颜色距离作为偏差百分比进行插入 .
示例
让我们使用上面发布的教程页面中的图像并在示例中使用它们 . 示例应用程序显示以下内容: - BGR到LAB转换 - (L)AB距离计算 - (L)AB距离归一化 - 根据BGR / LAB值和颜色距离阈值进行颜色分类 - 对象的颜色在变化的照明下如何变化条件 - 与其他颜色的距离如何变大/关闭图像变暗/变浅(如果仔细阅读发布的链接,这也会变得清晰) .
附加提示:该示例应显示单个颜色通常不足以在强烈变化的照明条件下检测颜色对象 . 解决方案可以是通过经验分析对每种颜色使用不同的颜色距离阈值 . 另一种方法是为要查找的每种颜色使用许多分类样本颜色 . 您必须计算每种样本颜色的颜色距离,并通过对结果进行OR运算来组合找到的值 .
代码和图像
(图片来自http://www.learnopencv.com/color-spaces-in-opencv-cpp-python/ - Satya Mallick的教程)