首页 文章
  • 338 votes
     answers
     views

    OpenCV-Python中的简单数字识别OCR

    我正在尝试在OpenCV-Python(cv2)中实现“数字识别OCR” . 它仅用于学习目的 . 我想在OpenCV中学习KNearest和SVM功能 . 我有每个数字的100个样本(即图像) . 我想和他们一起训练 . OpenCV示例附带了一个示例 letter_recog.py . 但我仍然无法理解样本,响应等等 . 另外,它首先加载一个txt文件,我首先不明白 . 稍后搜索一下,我可以...
  • 2 votes
     answers
     views

    ABBYY OCR SDK:我正在尝试一个示例脚本来识别名片但没有获得任何输出

    我正在尝试使用ABBYY.com的PHP中的OCR SDK来识别名片 . 我有以下代码只是为了检查它是如何工作的 . 当我执行代码时,我得到一个空白输出 . 我可能在代码上错误的地方? $applicationId = "MyBusinessCardReader"; $password = "password"; $filename = "busi...
  • 1 votes
     answers
     views

    Android项目中的Neuroph OCR-手写识别库

    我正在研究Android Studio中的手写识别项目 . 来自在线资源的Neuroph OCR似乎是最能识别手写字符的人 . 我的输入是x,y坐标列表,并使用opencv drawline函数绘制它们 然后创建一个显示char的图像,可以通过手写OCR识别图像 . 任何人都可以有一些说明或示例或来源我如何使用此库?我只知道它是一个有用的库,但很少找到任何例子
  • 6 votes
     answers
     views

    在OpenCV C中将车牌标准化为OCR

    我正在做一些简单的OCR车牌识别系统 . 我正在使用HaarCascades找到车牌,然后我需要将这个盘子标准化,将其放入我的OCR模块中 . 我正在使用填充来找到车牌的主要轮廓,然后我执行霍夫变换,找到车牌的上下边界: 这是代码的一部分,我执行Hough变换^ HoughLinesP(canny_img, lines, 1, CV_PI/180, 80, 80, 30 ); for...
  • 0 votes
     answers
     views

    日语字符编码问题

    我正在使用第三方OCR库将包含日语字符的图像转换为文本文件 . 当我通过双击打开它时创建的文本文件看起来没问题但是当我使用下面的代码在TextBox中加载它时它变得很奇怪 . this.textBox1.Text = File.ReadAllText(Outpath);
  • 2 votes
     answers
     views

    OCR与Android应用程序

    我想创建一个应用程序,人们可以在其中拍摄任何文本的照片,应用程序识别文本,复制并将其放入可编辑区域 . 文本的语言无关紧要 . 我只想自动识别角色 . 稍后的功能可以是提供文本翻译 . Android应用程序有没有ocr库?我记得google想要为ocr提供api(我在2011年得到的关于它的最新信息) . 因为它似乎还没有api .
  • 5 votes
     answers
     views

    使用ImageMagick删除收据图像边框

    我'm using ImageMagick service to pre-process the receipt image before using tesseract-OCR engine to extract texts. I need to remove the background of the receipts. I'已经通过掩蔽去除边框here.但我无法为收据创建掩码 . 但是,我试...
  • 2 votes
     answers
     views

    图像中的文本检测

    我正在使用下面的示例代码,使用coreml和vision在图像(非手写)中进行文本检测 . https://github.com/DrNeuroSurg/OCRwithVisionAndCoreML-Part2 在这里他们使用机器学习模型,它只支持大写和数字 . 在我的项目中,我想要大写,小写,数字和少数特殊字符(如:, - ) . 我没有任何python经验来进行必要的更改并使用列车数据生成所需...
  • 112 votes
     answers
     views

    图像处理,以提高tesseract OCR的准确性

    我一直在使用tesseract将文档转换为文本 . 文档的质量范围非常广泛,我正在寻找有关哪种图像处理可能会改善结果的提示 . 我注意到高度像素化的文本 - 例如由传真机生成的文本 - 对于tesseract来说特别难以处理 - 可能是角色的所有锯齿状边缘都会混淆形状识别算法 . 什么样的图像处理技术可以提高准确度?我一直在使用高斯模糊来平滑像素化图像并看到一些小的改进,但我希望有更具体的技术可以...
  • 68 votes
     answers
     views

    android中最好的OCR(光学字符识别)示例[关闭]

    我想在android中运行OCR的一个例子,我做了一些研究并找到了一个在android中实现OCR的例子 . https://github.com/rmtheis/tess-two并且其中有三个项目文件...... 双眼 tess-two tess-two-test 我通过导入三个项目文件执行了“tess-two-test”项目,但“tess-two-test”不包含任何活动,因此...
  • 1 votes
     answers
     views

    OCR识别改进

    我正在使用tesseract对某些视频流进行一些识别 . 我需要帮助改进,也可能正在寻找其他图像识别库 . 我有许多具有不同元素的流,因此每个流都必须设计为不同的识别 . 所以目前的流量都在抽搐 . 其中一个问题是,有时抽搐流的质量不同 - 我有720p,480p,360p . 我需要知道的是获胜团队和得分 . 主要问题atm是tesseract无法识别360p流中图像上的字符或字体 . 这是示例...
  • 1 votes
     answers
     views

    Unity3D - OCR号码识别

    我们的初始用例要求在Unity3D中编写应用程序(仅在C#中编写并同时部署到iOS和Android),允许移动电话用户将他们的相机保持到杂志文章的 Headers ,使用OCR来阅读 Headers ,然后我们将在后端处理该 Headers 以获取相关故事 . 由于其快速的原生字符识别,Vuforia对于这个用例来说是最好的 . 在初始应用程序进行了一些演示之后,出现了更多潜在用途 . 任何只需要...
  • 2 votes
     answers
     views

    从圆形边框内提取文本

    我正在尝试使用Python和OpenCV开发一个脚本来检测扫描仪器图上的一些突出显示的区域,并使用Tesseract的OCR功能输出文本 . 我的工作流程首先检测感兴趣区域的一般附近,然后应用处理步骤除去文本块(线条,边框,噪声)之外的所有内容 . 然后将处理后的图像输入Tesseract的OCR引擎 . 此工作流程适用于大约一半的图像,但由于文本触摸边框而导致其余部分失败 . 我将在下面展示一些...
  • 0 votes
     answers
     views

    使用Tesseract增加传真OCR

    各位大家好,感谢您的帮助 . 我正在学习使用Tesseract进行OCR和传入传真的文本提取 . 我试图阅读的许多TIFF文件看起来质量很好(灰度),并且是计算机生成的文档,即没有手写,没有需要旋转等等 . 但是,我只能达到约77%的准确率和我认为应该发生更多错误 . 是否有任何改进识别的最佳实践,请记住,我无法控制入站质量,还要记住我需要从多页文档中提取 . 任何帮助或示例将不胜感激 .
  • 0 votes
     answers
     views

    Android:NullPointer异常

    这是我在Logcat中得到的错误 . 04-23 08:00:07.524: E/AndroidRuntime(1384): FATAL EXCEPTION: main 04-23 08:00:07.524: E/AndroidRuntime(1384): java.lang.RuntimeException: Unable to start activity ...
  • 3 votes
     answers
     views

    VIN OCR数据集

    有没有人知道任何标记的数据集,包括VIN(车辆识别号码)的图像,或德国FIN(Fahrzeugidentifizierungsnummer)? 或者,如果没有,是否有任何其他数据集可用于培训OCR模型以进行自动VIN读取?即每个VIN必须具有san serif字体 . 谢谢,任何帮助表示赞赏 .
  • 2 votes
     answers
     views

    从PDF中提取表格数据,格式为图片[关闭]

    我正在尝试从document的第52页开始的表中提取数据(FAA的报告) . 问题是表格包含在图片中 . 我有机会在不手动操作的情况下获得如何做到这一点的一些指示吗? 我尝试使用Adobe的OCR功能将其转换为文本,我也尝试在R的tabulized包中使用extract_tables函数 . 我当然可以手动执行此操作,但最好知道是否有更有效的方法 .
  • -1 votes
     answers
     views

    从自然图像中检测文本

    我在 tensorflow 中编写代码,使用 convolution neural network 来自图像中的文本 detect . 我使用TFRecords文件来读取街景文本数据集,然后,我将图像的大小调整为 128 的高度和宽度 . 我使用了9- conv layer 和 zero padding 以及三个 max_pool layer with window size of (2×2)...
  • 24 votes
     answers
     views

    日本最准确的开源OCR? [关闭]

    根据您的经验,什么是最准确的开源光学字符识别(OCR)库/软件来阅读日文文本? 我刚试过nhocr,即使是非常干净的高清文件,它的错误率也超过了2% .
  • 12 votes
     answers
     views

    使用Android相机的简单OCR应用程序[重复]

    可能重复:android OCR? 我想要构建一个应用程序,它具有使用相机的OCR扫描仪,并从纸张中检测文本并转换为常规文本 . 一个简单的程序 . 我怎么能这样做?什么是最简单的方法?
  • 33 votes
     answers
     views

    字符识别(OCR算法)[关闭]

    我正在开发一个项目,我必须开发OCR算法(我必须从Image中读取文本,然后将其转换为不同的语言) . 所以我的第一个任务是从图像中获取文本 . 完成第一项任务的步骤 . 从给定来源加载任何图像格式(bmp,jpg,png) . 然后将图像转换为灰度并使用阈值(Otsu算法)对其进行二值化 . //完成(如何从输出图像中删除噪声???) 结果 检测分辨率和反转等图像特征 . 这样我们...
  • 11 votes
     answers
     views

    使用Tesseract OCR进行汉字识别

    我一直在使用Tesseract 3.0.2 OCR SDK进行图像文本提取 . 但是,如果我使用中文文本图像并通过OCR,那么Tesseract不会提供中文字符而不是我获得数字和英文字符 . 但是我需要在我正在使用的图像中显示中文字符 . 我怎样才能做到这一点?有什么方法可以获得汉字而不是任何其他字符吗?
  • 0 votes
     answers
     views

    使用tesseract ocr检测旋转字符(字母)的建议

    作为学生无人机项目的一部分,我们需要在一系列无字体文本的单字符图像上运行OCR . 使用Tesseract OCR大部分都是微不足道的,因为角色是高分辨率且定义明确的,但是我们正在与一个未知的角色挣扎 - 图像中角色的方向是未知的 . 通过分析周围环境,我们可以缩小范围,以便最终得到OCR图像,其中文本基线与图像的顶部,底部,左侧或右侧对齐 . 我们目前的方法是训练Tesseract,如果它识别一...
  • -1 votes
     answers
     views

    用于网站应用的OpenSource /付费OCR

    希望有人有答案,我已经用Google搜索并发现了Tesseract作为选项 - 但这可以集成到网络应用程序中吗?或者,是否有人知道可以集成到网站中的付费OCR,然后将OCR文本存储到要分析的数据库中? 助教 .
  • 0 votes
     answers
     views

    使用tesserocr库使用Python进行文本识别

    我想从an image捕获一个文本,我正在使用下面的这个脚本(script source) import cv2 import numpy as np import tesserocr from PIL import Image # Path of working folder on Disk src_path = "C:/Users/fyunu/OneDrive/Masaüstü/a...
  • 2 votes
     answers
     views

    使用OpenCV和pytesseract进行实时OCR

    我正在尝试开发基本的实时OCR来读取一个小文本块 . 我使用OCR的文本处理帧捕获帧,删除噪声,添加阈值,复制帧并将其传递给pytesseract以进行文本识别 . OCR的帧处理顺利通过,但是当pytesseract处理帧以提取文本时,它会经历大量滞后 . 我尝试通过为tysseract添加白名单选项来改善结果,但它无法解决性能问题 . 有没有办法绕过滞后?使用OpenCV深度学习文本识别能否...
  • 0 votes
     answers
     views

    在Jupyter中找不到文件

    我刚开始使用Python和Jupyter,所以我提前为一个简单的问题道歉 . 我已经安装了Tesseract,一个OCR,用于从图像中提取文本,我在查找图像时遇到了问题 . 如何指定图像的位置?这是我的代码如下 . import pytesseract from PIL import Image img = Image.open('539_2272.png') pytesseract.pytess...
  • 0 votes
     answers
     views

    TensorFlow DeepOCR无法提供形状值

    我想要照片中的OCR文字 . 阅读this文章我看到了github项目 . 我很想工作 但...我删除了 TFModel 文件夹中的所有文件 . 要重新创建 .当我跑 DeepOCR.py给出以下错误 . ValueError:无法为Tensor'FFIM:0'提供形状值(512,17,704,3),其形状为'(?,18,640,3)' 感谢你们对我的帮助
  • 16 votes
     answers
     views

    PDF的批量OCR程序[关闭]

    以前曾经问过,但我真的不知道这些答案对我有帮助 . 这是我的问题:我得到了一堆(10,000左右)pdf文件 . 有些是使用adobe的打印功能保存的文本文件(所以他们的文本是完美的,我不想冒险搞砸它们) . 有些是扫描图像(所以他们没有任何文字,我将不得不接受OCR) . 文件在同一目录中,我无法分辨哪个是哪个 . 最终我想将它们转换为.txt文件,然后对它们进行字符串处理 . 所以我希望最准确...
  • 0 votes
     answers
     views

    使用不正确的结构OCR从PDF中提取数据

    我有定期流入的发票pdfs . 我从这些pdf中提取数据以进行各种操作和存储 . 这是一个示例部分: 第一步是使用Adobe的OCR . 然后,我使用tika来解析pdf . 在Python中: from tika import parser parsedPDF = parser.from_file("the_file.pdf") 这是预期的输出: ... 001 6 0 6...

热门问题