文档光学字符识别制造技术

技术编号：20499761 阅读：20 留言：0更新日期：2019-03-03 03:24

车辆和其他项目通常具有对应的文档，比如登记卡，这种文档包括可以用于识别项目的大量告知性文本信息。当处理非合作图像时，传统的OCR可能会失败。因此，诸如去扭曲、文本对齐以及线条识别和移除之类的特征可以有助于非合作图像的OCR。去扭曲包括确定图像中所描绘的文档的曲率，并且对图像加以处理以使文档的图像去扭曲，进而使其更准确地满足合作图像的目标。文本对齐包括确定所描绘文本的实际对齐，即使是在所描绘文本没有与所描绘的视觉提示对齐时。线条识别和移除包括识别图像中的描绘线条的部分，并在进行图像的OCR处理之前移除那些线条。

Document Optical Character Recognition

Vehicles and other items usually have corresponding documents, such as registration cards, which include a large amount of informative text information that can be used to identify items. Traditional OCR may fail when processing non-cooperative images. Therefore, features such as de-distortion, text alignment, line recognition and removal can help OCR of non-cooperative images. De-distortion includes determining the curvature of the document depicted in the image, and processing the image to distort the image of the document, so that it can more accurately meet the target of the cooperative image. Text alignment includes determining the actual alignment of the depicted text, even when the depicted text is not aligned with the depicted visual cues. Line recognition and removal includes recognizing the parts of the lines depicted in the image, and removing those lines before OCR processing of the image.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】文档光学字符识别优先权主张本申请要求2016年5月25日提交的标题为“文档光学字符识别”的美国专利申请第15/164,594号的优先权，其全部内容通过引用的方式并入本文中。
本文公开的主题总体上涉及光学字符识别。具体地，本公开涉及与项目描述文档的图像中的文本光学字符识别有关的系统和方法。
技术介绍
光学字符识别(OCR)在文档上的文本与图像的边缘对齐且图像质量较高时用来识别文本图像中的字符。具有适当光线水平的图像(其中文档直接面向摄像机并与其恰当地对齐，并且其中图像不包含除文档以外的任何对象)被称为“合作的”。缺少这些特征中的一个或多个特征的图像被称为“非合作的”。例如，光线水平较差的图像或者包括遮挡了文档的一个或多个部分的遮蔽物的图像是非合作的。在处理非合作图像时，传统的OCR可能会失败。附图说明在附图中，通过示例而非限制性的方式示出了一些实施例。图1是示出了根据一些示例性实施例的适合于车辆登记光学字符识别的网络环境的网络图。图2是示出了根据一些示例性实施例的适合于车辆登记光学字符识别的识别服务器的组件的框图。图3是示出了根据一些示例性实施例的适合于捕获文档的图像并与配置为基于图像来识别项目的服务器进行通信的设备的组件的框图。图4示出了根据一些示例性实施例的文档的示例性二值化图像。图5示出了根据一些示例性实施例的文档的示例性去扭曲图像。图6示出了根据一些示例性实施例的图像中的检测到的线条的示例。图7示出了根据一些示例性实施例的图像中的检测到的页面边界的示例。图8示出了根据一些示例性实施例的图像中的检测到的文本位置的示例。图9示出了根据一些示例性实施例的图...

【技术保护点】
1.一种系统，包括：存储指令的存储器；以及一个或多个处理器，由所述指令配置为执行包括以下的操作：访问图像；确定所述图像的描绘文本的部分；识别所述图像中描绘的线段的颜色，所述线段处于所述图像的描绘文本的所述部分之外；以及通过对所述图像的描绘文本的所述部分执行光学字符识别且同时忽略所述图像的所述部分内具有所述线段的所述颜色的元素，识别所述文本。

【技术特征摘要】
【国外来华专利技术】2016.05.25 US 15/164,5941.一种系统，包括：存储指令的存储器；以及一个或多个处理器，由所述指令配置为执行包括以下的操作：访问图像；确定所述图像的描绘文本的部分；识别所述图像中描绘的线段的颜色，所述线段处于所述图像的描绘文本的所述部分之外；以及通过对所述图像的描绘文本的所述部分执行光学字符识别且同时忽略所述图像的所述部分内具有所述线段的所述颜色的元素，识别所述文本。2.根据权利要求1所述的系统，其中识别所述线段的所述颜色包括：确定所述颜色的多个不同颜色值，所述多个不同颜色值中的每一个对应于所述图像的描绘文本的所述部分的不同子部分。3.根据权利要求1所述的系统，其中对所述图像的描绘文本的所述部分执行光学字符识别包括：确定所述线段的所述颜色与所述图像的描绘文本的所述部分的每个元素的颜色之间的差值。4.根据权利要求3所述的系统，其中忽略所述部分内具有所述线段的所述颜色的元素包括：将每个元素的所述差值与预定阈值进行比较。5.根据权利要求1所述的系统，其中识别所述线段的所述颜色包括：将二元分类器应用于所述图像的一部分，以识别所述图像的描绘所述线段的部分。6.根据权利要求5所述的系统，其中识别所述线段的所述颜色还包括：确定所述图像的描绘所述线段的所述部分的平均颜色。7.根据权利要求1所述的系统，其中确定所述图像的描绘文本的部分包括：使用边缘检测来确定所述图像内的垂直能量的分布。8.根据权利要求1所述的系统，其中确定所述图像的描绘文本的部分包括：在所述图像上迭代地叠加网格，所述网格的参数对于每次迭代是不同的；在每次迭代中，确定所述网格与所述图像中描绘的前景项目之间的重叠程度；以及选择与所述迭代中最低重叠程度相对应的所述网格的参数。9.根据权利要求1所述的系统，其中所述操作还包括：使用所述文本来填充在线市场中的项目列表。10.根据权利要求9所述的系统，其中：所述图像描绘了车辆的车辆登记；以及所述项目列表是所述车辆的项目列表。11.一种方法，包括：访问图像；确定所述图像的描绘文本的部分；识别所述图像中描绘的线段的颜色，所述线段处于所述图像的描...

【专利技术属性】
技术研发人员：布拉德克·加斯克尔，鲁宾逊·皮拉姆苏，
申请(专利权)人：电子湾有限公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人