用于图像识别的方法、装置、设备和计算机可读存储介质制造方法及图纸

技术编号：18576496 阅读：37 留言：0更新日期：2018-08-01 11:33

本公开的实施例涉及用于图像识别的方法、装置、计算设备以及计算机可读存储介质。该方法包括：识别第一图像中的字符；响应于确定识别出的字符与模板图像的至少一个参考定位区域中的字符相匹配，从第一图像中确定与至少一个参考定位区域相对应的至少一个第一区域；利用至少一个参考定位区域和至少一个第一区域，基于第一图像确定与模板图像相匹配的第二图像；以及从第二图像中确定与模板图像中的参考识别区域相对应的第二区域中的字符。本公开的实施例能够在原始图像质量较差的情况下实现图像识别。另外，还可以根据不同的模板图像来确定不同的信息，例如，可以获得不同字段之间的关系。

Method, device, device and computer readable storage medium for image recognition

Embodiments of the disclosure relate to methods, devices, computing devices, and computer-readable storage media for image recognition. The method includes: identifying the characters in the first image; in response to determining the identified characters to match the characters in at least one reference location area of the template image, at least one first area corresponding to at least one reference location area is determined from the first image; at least one reference location area and at least a reference location area is used. A first region determines the second image matching the template image based on the first image, and the characters in the second region corresponding to the reference recognition area in the template image from the second image. The embodiment of this disclosure can realize image recognition in the case of poor original image quality. In addition, different information can be determined according to different template images, for example, the relationship between different fields can be obtained.

全部详细技术资料下载

【技术实现步骤摘要】
用于图像识别的方法、装置、设备和计算机可读存储介质
本公开的实施例总体涉及图像处理领域，并且更具体地涉及用于图像识别的方法、装置、计算设备和计算机可读存储介质。
技术介绍
当前存在各种文字识别工具，将图像中的文字识别出来，按行输出。然而，当前的文字识别工具的前置条件较多，例如，要求较高的图像质量，对准图像进行拍摄。然而，在图像存在严重畸变的情况下，这些文字识别工具可能无法获得较好的文字识别结果。另外，这些文字识别工具对于图像中的结构化数据的识别也是困难的。例如，这些文字识别工具通常无法获得结构化数据的字段之间的关系。例如，如果针对某一类发票进行识别，金额项和金额数值的关系在文字识别时被破坏，用户无法直接从金额里提取需要的数值，这对于数据的上层处理带来了巨大的障碍。
技术实现思路
根据本公开的示例实施例，提供了一种用于图像识别的方法和装置。根据本公开的第一方面，提供了一种用于图像识别的方法。所述方法包括：识别第一图像中的字符；响应于确定识别出的所述字符与模板图像的至少一个参考定位区域中的字符相匹配，从所述第一图像中确定与所述至少一个参考定位区域相对应的至少一个第一区域；利用所述至少一个参考定位区域和所述至少一个第一区域，基于所述第一图像确定与所述模板图像相匹配的第二图像；以及从所述第二图像中确定与所述模板图像中的参考识别区域相对应的第二区域中的字符。根据本公开的第二方面，提供了一种用于图像识别的装置。所述装置包括：字符识别模块，被配置为识别第一图像中的字符；区域确定模块，被配置为响应于确定识别出的所述字符与模板图像的至少一个参考定位区域中的字符相匹配，从所述第一...

【技术保护点】
1.一种用于图像识别的方法，包括：识别第一图像中的字符；响应于确定识别出的所述字符与模板图像的至少一个参考定位区域中的字符相匹配，从所述第一图像中确定与所述至少一个参考定位区域相对应的至少一个第一区域；利用所述至少一个参考定位区域和所述至少一个第一区域，基于所述第一图像确定与所述模板图像相匹配的第二图像；以及从所述第二图像中确定与所述模板图像中的参考识别区域相对应的第二区域中的字符。

【技术特征摘要】
1.一种用于图像识别的方法，包括：识别第一图像中的字符；响应于确定识别出的所述字符与模板图像的至少一个参考定位区域中的字符相匹配，从所述第一图像中确定与所述至少一个参考定位区域相对应的至少一个第一区域；利用所述至少一个参考定位区域和所述至少一个第一区域，基于所述第一图像确定与所述模板图像相匹配的第二图像；以及从所述第二图像中确定与所述模板图像中的参考识别区域相对应的第二区域中的字符。2.根据权利要求1所述的方法，其中确定识别出的所述字符与模板图像的至少一个参考定位区域中的字符相匹配包括：响应于识别出的所述字符包括所述至少一个参考定位区域中的字符的至少一部分，确定识别出的所述字符与所述至少一个参考定位区域中的字符相匹配。3.根据权利要求1所述的方法，其中从所述第一图像中确定与所述至少一个参考定位区域相对应的所述至少一个第一区域包括：从所述第一图像中确定与所述至少一个参考定位区域相对应的多个候选区域；以及从所述多个候选区域中去除异常的候选区域，以得到所述至少一个第一区域。4.根据权利要求1所述的方法，其中所述至少一个第一区域包括多个第一区域，所述至少一个参考区域包括多个参考定位区域，并且基于所述第一图像确定与所述模板图像相匹配的第二图像包括：利用所述多个第一区域和所述多个参考定位区域，对所述第一图像进行透视变换，以得到所述第二图像。5.根据权利要求4所述的方法，其中对所述第一图像进行透视变换包括：基于所述多个第一区域和所述多个参考定位区域，计算透视投影矩阵；以及对所述第一图像应用所述透视投影矩阵，以得到所述第二图像。6.根据权利要求1所述的方法，其中基于所述第一图像确定与所述模板图像相匹配的第二图像包括：基于所述参考定位区域和所述第一区域，将所述第一图像变换为第三图像；响应于确定所述第三图像与所述模板图像不匹配，从所述第三图像中确定与所述参考定位区域相对应的第三区域；以及基于所述参考定位区域和所述第三区域，从所述第三图像确定与所述模板图像相匹配的第二图像。7.根据权利要求1所述的方法，还包括：响应于所述参考识别区域的至少一部分是表格，从所述第二区域中的字符确定多个字符序列；基于所述多个字符序列之间的位置关系，使所述多个字符序列之间彼此匹配。8.一种用于图像识别的装置，包括：字符识别模块，被配置为识别第一图像中的字符；区域确定模块，被配置为响应于确定识别出的所述字符与模板图像的至少一个参考定位区域中的字符相匹配，从所述第一图像中确定与所述至少一个参考定位区域相对应的至少一个第一...

【专利技术属性】
技术研发人员：向宇波，袁运筹，王天天，陈帆，李琦，陈涛涛，张红光，刘建夏，娄双双，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人