作为学生无人机项目的一部分,我们需要在一系列无字体文本的单字符图像上运行OCR . 使用Tesseract OCR大部分都是微不足道的,因为角色是高分辨率且定义明确的,但是我们正在与一个未知的角色挣扎 - 图像中角色的方向是未知的 . 通过分析周围环境,我们可以缩小范围,以便最终得到OCR图像,其中文本基线与图像的顶部,底部,左侧或右侧对齐 .

我们目前的方法是训练Tesseract,如果它识别一种新语言(实际上这只是英语,字符为0度,90度,180度和270度) . 例如,即使A旋转了90度的任何整数倍,也应该将A识别为A.

Tesseract是否可以实现这一目标?尽管进行了长时间的研究,我们仍在努力弄清楚如何解决这个问题 .

提前致谢 .