文本识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38826767 阅读:5 留言:0更新日期:2023-09-15 20:06
本发明专利技术涉及一种文本识别方法、装置、计算机设备及存储介质,方法包括:对待识别图像文本进行OCR处理,以得到待识别图像文本的文本块集合;利用待识别图像文本的文本块集合生成待识别图像文本的周围信息集合;将待识别图像文本的周围信息集合与已保存的模板的周围信息进行对比,以确定出待识别图像文本所属的模板类型;根据确定出的模板类型从待识别图像文本中提取出业务所需字段。本发明专利技术能够精确的识别出待识别图像文本的类型,并且在对比时,通过比较周围信息来匹配关键信息可以有更好的鲁棒性,从而为位置不是固定不变的的定制化的识别需求提供了解决方式。识别需求提供了解决方式。识别需求提供了解决方式。

【技术实现步骤摘要】
文本识别方法、装置、计算机设备及存储介质


[0001]本专利技术涉及计算机
,更具体地说是文本识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]实际生产环境中有这样一种情景:从待识别图片中获取所需的文本信息。例如从一张身份证正面的照片获取身份证号,从机票的照片里获取航班,起飞时间等等。对于从身份证照片获取身份证号这样的问题,已经有很成熟的解决方案,例如,在填写个人信息的时候,上传身份证照片后,身份证信息填写那一栏被自动填充了。这就是服务端根据上传的身份证照片做了一个信息提取的处理。
[0003]虽然从身份证照片获取身份证号是一件很容易的事情,但是从任意图片获取任意关键信息却是一件非常困难的事情。究其原因是在身份证照片中各文本内容的位置是固定不变的,也即需要提取的字段的坐标是固定的,其识别的机制是:通过OCR识别技术对待识别身份证进行处理,得到文本块,然后再将需要提取的字段的坐标位置的文本块的文本内容识别出来即可,这种识别类型前提是知道属于身份证的类型,而且文本内容的位置是固定不变。
[0004]而在实际生活中具有各种各样的定制化的需求,例如,前提不知道输入的待识别图片属于哪种类型,而且对于属于同一类型的待识别图片其文本内容的位置不是固定不变的(文本内容可能有些许平移,旋转,放大缩小等情况),因此,对于这种需求目前没有比较可靠的识别手段。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的不足,提供文本识别方法、装置、计算机设备及存储介质,旨在为前提不知道输入的待识别图片属于哪种类型,而且对于属于同一类型的待识别图片其文本内容的位置不是固定不变的的定制化的识别需求提供可靠的识别手段。
[0006]为实现上述目的,本专利技术采用以下技术方案:
[0007]第一方面,文本识别方法,包括:
[0008]获取待识别图像文本;
[0009]对待识别图像文本进行OCR处理,以得到待识别图像文本的文本块集合;
[0010]利用待识别图像文本的文本块集合生成待识别图像文本的周围信息集合;
[0011]将待识别图像文本的周围信息集合与已保存的模板的周围信息进行对比,以确定出待识别图像文本所属的模板类型;
[0012]根据确定出的模板类型从待识别图像文本中提取出业务所需字段。
[0013]基于第一方面,进一步技术方案为:所述利用待识别图像文本的文本块集合生成待识别图像文本的周围信息集合,包括:
[0014]获取各文本块组合单元相邻的若干个文本块,所述文本块组合单元由至少一个文
本块组成;
[0015]计算各文本块组合单元与其相邻的若干个文本块的距离和角度,以得到各文本块组合单元的相对距离和相对角度信息;
[0016]将各文本块组合单元的相对距离和相对角度信息与各文本块组合单元的文本内容进行关联后并保存。
[0017]基于第一方面,进一步技术方案为:所述将待识别图像文本的周围信息集合与已保存的模板的周围信息进行对比,以确定出待识别图像文本所属的模板类型,包括:
[0018]遍历待识别图像文本的周围信息集合;
[0019]判断待识别图像文本的周围信息集合中是否存在与某一已保存的模板的周围信息的相似度达到预设值;
[0020]若是,则判定待识别图像文本属于与其相似度达到预设值的所对应的模板类型。
[0021]基于第一方面,进一步技术方案为:所述对待识别图像文本进行OCR处理,以得到待识别图像文本的文本块集合之前,还包括:
[0022]对待识别图像文本进行表格识别处理,以去除待识别图像文本中的表格框线。
[0023]基于第一方面,进一步技术方案为:所述对待识别图像文本进行表格识别处理,以去除待识别图像文本中的表格框线,包括:
[0024]利用卷积核矩阵对待识别图像文本进行像素腐蚀处理;
[0025]对像素腐蚀处理后的图像进行像素膨胀处理;
[0026]计算像素膨胀处理后的图像中水平线和垂直线的交集,以得到包含表格边界所有交点的二进制图像;
[0027]从包含表格边界所有交点的二进制图像查找出表格中每个单元格的四个顶点坐标;
[0028]根据每个单元格的四个顶点坐标去除表格中所有框线。
[0029]基于第一方面,进一步技术方案为:所述获取待识别图像文本之前,包括:
[0030]根据需求进行模板标注。
[0031]基于第一方面,进一步技术方案为:所述根据需求进行模板标注,包括:
[0032]从经过OCR处理的模板内容中选取第一标注区域和第二标注区域,所述第一标注区域为模板的至少部分不变量字段,第二标注区域为模板的至少部分变量字段;
[0033]生成第一标注区域和第二标注区域的周围信息集合并保存。
[0034]第二方面,文本识别装置,包括获取单元、OCR处理单元、周围信息生成单元、对比单元以及文本内容提取单元;
[0035]所述获取单元,用于获取待识别图像文本;
[0036]所述OCR处理单元,用于对待识别图像文本进行OCR处理,以得到待识别图像文本的文本块集合;
[0037]所述周围信息生成单元,用于利用待识别图像文本的文本块集合生成待识别图像文本的周围信息集合;
[0038]所述对比单元,用于将待识别图像文本的周围信息集合与已保存的模板的周围信息进行对比,以确定出待识别图像文本所属的模板类型;
[0039]所述文本内容提取单元,用于根据确定出的模板类型从待识别图像文本中提取出
业务所需字段。
[0040]第三方面,一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的文本识别方法。
[0041]第四方面,一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,使得所述处理器执行如上述的文本识别方法。
[0042]本专利技术与现有技术相比的有益效果是:对待识别图像文本进行OCR处理,以得到待识别图像文本的文本块集合;利用待识别图像文本的文本块集合生成待识别图像文本的周围信息集合;将待识别图像文本的周围信息集合与已保存的模板的周围信息进行对比,以确定出待识别图像文本所属的模板类型;根据确定出的模板类型从待识别图像文本中提取出业务所需字段。通过基于周围信息的对比,首先判断出待识别图像文本属于哪种模板类型,然后提取出业务所需字段,能够精确的识别出待识别图像文本的类型,并且在对比时,比较的是周围信息,即使待识别图像文本中的文本内容位置不是固定的,但周围的内容是比较固定的,比较周围信息来匹配关键信息可以有更好的鲁棒性,从而为位置不是固定不变的的定制化的识别需求提供了解决方式。
[0043]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术技术手段,可依照说明书的内容予以实施,并且为了让本专利技术的上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.文本识别方法,其特征在于,包括:获取待识别图像文本;对待识别图像文本进行OCR处理,以得到待识别图像文本的文本块集合;利用待识别图像文本的文本块集合生成待识别图像文本的周围信息集合;将待识别图像文本的周围信息集合与已保存的模板的周围信息进行对比,以确定出待识别图像文本所属的模板类型;根据确定出的模板类型从待识别图像文本中提取出业务所需字段。2.根据权利要求1所述的文本识别方法,其特征在于,所述利用待识别图像文本的文本块集合生成待识别图像文本的周围信息集合,包括:获取各文本块组合单元相邻的若干个文本块,所述文本块组合单元由至少一个文本块组成;计算各文本块组合单元与其相邻的若干个文本块的距离和角度,以得到各文本块组合单元的相对距离和相对角度信息;将各文本块组合单元的相对距离和相对角度信息与各文本块组合单元的文本内容进行关联后并保存。3.根据权利要求1所述的文本识别方法,其特征在于,所述将待识别图像文本的周围信息集合与已保存的模板的周围信息进行对比,以确定出待识别图像文本所属的模板类型,包括:遍历待识别图像文本的周围信息集合;判断待识别图像文本的周围信息集合中是否存在与某一已保存的模板的周围信息的相似度达到预设值;若是,则判定待识别图像文本属于与其相似度达到预设值的所对应的模板类型。4.根据权利要求1所述的文本识别方法,其特征在于,所述对待识别图像文本进行OCR处理,以得到待识别图像文本的文本块集合之前,还包括:对待识别图像文本进行表格识别处理,以去除待识别图像文本中的表格框线。5.根据权利要求4所述的文本识别方法,其特征在于,所述对待识别图像文本进行表格识别处理,以去除待识别图像文本中的表格框线,包括:利用卷积核矩阵对待识别图像文本进行像素腐蚀处理;对像素腐蚀处理后的图像进行像素膨胀处理;计算像...

【专利技术属性】
技术研发人员:任福平王效东
申请(专利权)人:深圳市科通技术股份有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1