这是原始屏幕截图,我将图像裁剪成4个部分,并将图像的背景清除到我可以做的范围,但tesseract只检测到最后一列而忽略了其余部分 .
显示tesseract的输出,因为在处理结果时我删除了空格
Femme—Fatale.
DaRkLoRdEIa
aChineseN1gg4
Noob_Diablo_
显示tesseract的输出,因为在处理结果时我删除了空格
Kicked.
NosNoel
ChikiZD
Death_Eag|e_42
Chai—.
3579 10 1 7 148
2962 3 O 7 101
2214 2 2 7 99
2205 1 3 6 78
8212
7198
6307
5640
4884
15
40
40
6O
80
80
我只是倾销输出
result = `pytesseract.image_to_string(Image.open("D:/newapproach/B&W"+str(i)+".jpg"),lang="New_Language")`
但是我不知道如何从这里开始得到一致的结果 . 无论如何,我可以强制tesseract识别文本区域并使其扫描 . 因为在培训师(SunnyPage)中,tesseract在默认识别扫描它无法识别某些区域,但一旦我选择了手动,一切都被检测到并正确翻译成文本
4 回答
尝试使用命令行,它可以选择决定使用哪个 psm 值 .
你可以尝试这个:
尝试使用您和以下提供的图像是结果:
Extracted Text Out of Image
我面临的唯一问题是我的tesseract词典将你图像中提供的“1”解释为“我” .
以下是可用的psm选项列表:
pagesegmode值为:0 =仅限方向和脚本检测(OSD) .
1 =使用OSD自动分页 .
2 =自动页面分割,但没有OSD或OCR
3 =全自动页面分割,但没有OSD . (默认)
4 =假设一列可变大小的文本 .
5 =假设一个垂直对齐文本的统一块 .
6 =假设一个统一的文本块 .
7 =将图像视为单个文本行 .
8 =将图像视为单个单词 .
9 =将图像视为圆形中的单个单词 .
10 =将图像视为单个字符 .
我用过这个链接
https://www.howtoforge.com/tutorial/tesseract-ocr-installation-and-usage-on-ubuntu-16-04/
只需使用以下命令,可以将准确度提高50%
它只会显示粗体字母
谢谢
我的建议是对整个图像执行OCR .
我已预处理图像以获得灰度图像 .
我已经从终端上运行了图像上的tesseract,在这种情况下,准确度似乎也超过了90% .
以下是一些建议 -
不要直接使用image_to_string方法,因为它将图像转换为bmp并以72 dpi保存 .
如果要使用image_to_string,则覆盖它以300 dpi保存图像 .
您可以使用run_tesseract方法然后读取输出文件 .
我运行OCR的图像 .
我认为你必须先对图像进行预处理,对我有用的变化是:假设
img.resize(img.size [0] * 2,img.size [1] * 2)
img.convert( 'LA')
使字符更大胆,你可以在这里看到一种方法:https://blog.c22.cc/2010/10/12/python-ocr-or-how-to-break-captchas/但这种方法相当慢,如果你使用它,我会建议使用另一种方法
选择,反转选择,使用gimpfu填充黑色,白色
image = pdb.gimp_file_load(file,file)layer = pdb.gimp_image_get_active_layer(image)REPLACE = 2 pdb.gimp_by_color_select(layer,“#000000”,20,REPLACE,0,0,0,0)pdb.gimp_context_set_foreground((0 ,0,0))pdb.gimp_edit_fill(layer,0)pdb.gimp_context_set_foreground((255,255,255))pdb.gimp_edit_fill(layer,0)
pdb.gimp_selection_invert(image)pdb.gimp_context_set_foreground((0,0,0))