印章文字识别方法、电子设备及存储介质技术

技术编号:37843304 阅读:14 留言:0更新日期:2023-06-14 09:48
本申请实施例提供一种印章文字识别方法、电子设备及存储介质,首先,通过对包括印章的对象图片进行印章检测以获取印章的形状类别信息、位置信息和印章关键点的位置信息,接着,根据印章的位置信息从对象图片中获取原始印章图像,并对原始印章图像进行降噪处理,得到印章图像;最后,对不同形状类别的印章利用其印章关键点的位置信息对印章图像进行图像处理,以获取一个或多个待文字识别图像,并对一个或多个待文字识别图像进行文字识别,得到印章的文字识别结果。由此,提供了一种新的印章文字识别方式,该方式可以有效地提高印章文字的识别准确率,并支持对多种样式、多种颜色和多种形状的印章进行文字识别。多种形状的印章进行文字识别。多种形状的印章进行文字识别。

【技术实现步骤摘要】
印章文字识别方法、电子设备及存储介质


[0001]本申请涉及图像处理
,尤其涉及一种印章文字识别方法、电子设备及存储介质。

技术介绍

[0002]针对加盖印章的文件,印章文字是文件的重要信息之一,需要准确地识别出来。实际应用中,印章的形状类别多种多样,例如包括但不限于:圆形印章、方形印章和椭圆形印章;印章文字的布局和弯曲角度、印泥量、印章盖印时的角度、印章颜色、印章下方区域的文字也复杂多变;上述因素会增加印章文字识别的难度,影响了印章文字的识别准确率。

技术实现思路

[0003]本申请的多个方面提供一种印章文字识别方法、电子设备及存储介质,用以提高印章文字的识别准确率。
[0004]本申请实施例提供一种印章文字识别方法,包括:对包括印章的对象图片进行印章检测,得到印章检测结果,印章检测结果包括印章的形状类别信息、位置信息和印章关键点的位置信息;根据印章的位置信息从对象图片中获取原始印章图像;对原始印章图像进行降噪处理,得到印章图像;根据形状类别信息和印章关键点的位置信息,对印章图像进行图像处理,得到至少一个待文字识别图像;对至少一个待文字识别图像进行文字识别,得到印章的文字识别结果。
[0005]本申请实施例还提供一种印章文字识别方法,应用于云服务器,该方法包括:接收终端设备发送的印章文字识别请求,印章文字识别请求携带包括印章的对象图片;响应于印章文字识别请求,对对象图片进行印章检测,得到印章检测结果,印章检测结果包括印章的形状类别信息、位置信息和印章关键点的位置信息;根据印章的位置信息从对象图片中获取原始印章图像;对原始印章图像进行降噪处理,得到印章图像;根据形状类别信息和印章关键点的位置信息,对印章图像进行图像处理,得到至少一个待文字识别图像;对至少一个待文字识别图像进行文字识别,得到印章的文字识别结果;向终端设备返回印章的文字识别结果。
[0006]本申请实施例还提供一种电子设备,包括:存储器和处理器;存储器,用于存储计算机程序;处理器耦合至存储器,用于执行计算机程序以用于执行印章文字识别方法中的步骤。
[0007]本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,当计算机程序被处理器执行时,致使处理器能够实现印章文字识别方法中的步骤。
附图说明
[0008]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0009]图1为本申请实施例提供的一种应用场景图;
[0010]图2为本申请实施例提供的一种印章文字识别方法的流程图;
[0011]图3为本申请实施例提供的示例性的三种印章;
[0012]图4为本申请实施例提供的示例性的方形印章旋转过程图;
[0013]图5为本申请实施例提供的示例性的圆形印章的图像处理过程图;
[0014]图6为本申请实施例提供的示例性的椭圆形印章的图像处理过程图;
[0015]图7a为本申请实施例提供的示例性的噪声印章图像和纯净印章图像;
[0016]图7b为本申请实施例提供的一种模型训练原理图;
[0017]图7c为本申请实施例提供的另一种印章文字识别方法的流程图;
[0018]图8为本申请实施例提供的另一种印章文字识别方法的流程图;
[0019]图9为本申请实施例提供的一种印章文字识别装置的结构示意图;
[0020]图10为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0021]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0022]在本申请的实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的访问关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。在本申请的文字描述中,字符“/”一般表示前后关联对象是一种“或”的关系。此外,在本申请实施例中,“第一”、“第二”、“第三”、等只是为了区分不同对象的内容而已,并无其它特殊含义。
[0023]实际应用中,印章的形状类别多种多样,例如包括但不限于:圆形印章、方形印章和椭圆形印章;印章文字的布局和弯曲角度、印泥量、印章盖印时的角度、印章颜色、印章下方区域的文字也复杂多变;上述因素会增加印章文字识别的难度,影响了印章文字的识别准确率。
[0024]基于上述,本申请实施例提供一种印章文字识别方法、电子设备及存储介质,在本申请实施例中,首先,通过对包括印章的对象图片进行印章检测以获取印章的形状类别信息、位置信息和印章关键点的位置信息,接着,根据印章的位置信息从对象图片中获取原始印章图像,并对原始印章图像进行降噪处理,得到印章图像;最后,对不同形状类别的印章利用其印章关键点的位置信息对印章图像进行图像处理,以获取一个或多个待文字识别图像,并对一个或多个待文字识别图像进行文字识别,得到印章的文字识别结果。由此,提供了一种新的印章文字识别方式,该方式可以有效地提高印章文字的识别准确率,并支持对多种样式、多种颜色和多种形状的印章进行文字识别。
[0025]图1为本申请实施例提供的一种应用场景图。实际应用中,印章文字的识别需求非常普遍。例如,在政务行业有许多文件数据需要处理,文件上的印章是其中的重要信息之一,识别文件上的印章文字对于政务行业有着巨大的价值。又例如,在发票报销场景,需要识别加盖有印章的发票上的印章文字。又例如,在合同管理场景,需要识别加盖有印章的合
同上的印章文字。
[0026]当用户存在印章文字需求时,参见图1中的

所示,利用扫描仪对纸质版的加盖印章的文件进行文件扫描,得到包括印章的对象图片。当然,也可以利用图像采集设备对纸质版的加盖印章的文件进行拍摄,得到包括印章的对象图片。其中,图像采集设备可以是任意具有图像采集功能的设备。例如,图像采集设备按照传感器的结构特性可以分为面阵相机和线阵相机。又例如,图像采集设备按照画面分辨率不同可以分为标清摄像机和高清摄像机。又例如,图像采集设备按照信号分类可以是模拟摄像机和数字摄像机。
[0027]参见图1中的

所示,扫描仪将包括印章的对象图片发送给用户的终端设备。参见图1中的

所示,用户触发终端设备向云服务器发送印章文字识别请求,印章文字识别请求携带包括印章的对象图片。参见图1中的

所示,云服务器响应于印章文字识别请求,对包括印章的对象图片进行印章检测,印章检测结果包括印章的形状类别信息、位置信息和印章关键点的位置信息。参见本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种印章文字识别方法,其特征在于,包括:对包括印章的对象图片进行印章检测,得到印章检测结果,所述印章检测结果包括所述印章的形状类别信息、位置信息和印章关键点的位置信息;根据所述印章的位置信息从所述对象图片中获取原始印章图像;对所述原始印章图像进行降噪处理,得到印章图像;根据所述形状类别信息和所述印章关键点的位置信息,对所述印章图像进行图像处理,得到至少一个待文字识别图像;对至少一个待文字识别图像进行文字识别,得到所述印章的文字识别结果。2.根据权利要求1所述的方法,其特征在于,根据所述形状类别信息和所述印章关键点的位置信息,对所述印章图像进行图像处理,得到至少一个待文字识别图像包括:若所述形状类别信息为方形,则根据所述印章关键点的位置信息,对所述印章图像进行图像旋转处理,得到至少一个待文字识别图像;若所述形状类别信息为圆形或椭圆形,则根据所述印章关键点的位置信息,对所述印章图像进行图像旋转处理、极坐标变换和掩码处理,得到至少一个待文字识别图像。3.根据权利要求2所述的方法,其特征在于,若所述形状类别信息为方形,则根据所述印章关键点的位置信息,对所述印章图像进行图像旋转处理,得到至少一个待文字识别图像,包括:若所述形状类别信息为方形,所述印章关键点包括所述印章的右下角顶点、左下角顶点和印章中心点,则根据所述右下角顶点和所述左下角顶点各自的位置信息,确定所述右下角顶点和所述左下角顶点的连线方向与水平方向之间的第一夹角;以所述印章中心点为旋转中心,将所述印章图像旋转所述第一夹角,得到所述待文字识别图像。4.根据权利要求2所述的方法,其特征在于,若所述形状类别信息为圆形,则根据所述印章关键点的位置信息,对所述印章图像进行图像旋转处理、极坐标变换和掩码处理,得到至少一个待文字识别图像,包括:若所述形状类别信息为圆形,所述印章关键点包括所述印章的印章中心点、用于界定印章主体名称中首个文字的第一圆周点和用于界定印章主体名称中最后一个文字的第二圆周点,则根据所述印章中心点、所述第一圆周点和所述第二圆周点各自的位置信息,确定所述印章图像中的不包括印章主体名称的第一扇形区域以及确定复制印章图像中的包括印章主体名称的第二扇形区域,其中,所述复制印章图像是对所述印章图像进行复制处理得到;对所述印章图像中的第一扇形区域进行掩码处理,得到掩码后的印章图像,以及对所述掩码后的印章图像依次进行图像旋转处理和极坐标变换,得到第一待文字识别图像;对所述复制印章图像中的第二扇形区域进行掩码处理,得到掩码后的复制印章图像,以及对所述掩码后的复制印章图像进行图像旋转处理,得到第二待文字识别图像;对所述第二待文字识别图像进行极坐标变换,得到第三待文字识别图像。5.根据权利要求4所述的方法,其特征在于,确定所述印章图像中的不包括印章主体名称的第一扇形区域,以及确定复制印章图像中的包括印章主体名称的第二扇形区域,包括:根据所述印章中心点、所述第一圆周点和所述第二圆周点各自的位置信息,确定第一
连线方向和第二连线方向之间的第二夹角;其中,所述第一连线方向是指所述印章中心点和所述第一圆周点的连线方向,所述第二连线方向是指所述印章中心点和所述第二圆周点的连线方向;将所述印章图像和所述复制印章图像中以所述印章中心点为顶点,以所述第二夹角为圆心角的扇形区域确定为所述第一扇形区域;将所述复制印章图像中除去所述第一扇形区域之外的扇形区域确定为所述第二扇形区域。6.根据权利要求1所述的方法,其特征在于,若所述形状类别信息为椭圆形,则根据所述印章关键点的位置信息,对所述印章图像进行图像旋转处理、极坐标变换和掩码处理,得到至少一个待文字识别图像,包括:若所述形状类别信息为椭圆形,根据所述印章关键点的位置信息,对所述印章图像依次执行图像旋转和尺寸调整操作,得到第一圆形印章图像;获取对所述第一圆形印章图像进行复制处理得到的第二圆形印章图像和第三圆形印章图像;根据所述第一圆形印章图像中印章关键点的位置信息,确定所述第一圆形印章图像、所述第二圆形印章图像和所述第三圆形印章图像中的待掩码区域;对所述第一圆形印章图像、所述第二圆形印章图像和所述第三圆形印章图像中的待掩码区域分别进行掩码处理;将掩码后的所述第二圆形印章图像作为第四待文字识别图像,以及对掩码后的所述第一圆形印章图像和掩码后的所述第三圆形印章图像分别进行极坐标变换,以分别得到第五待文字识别图像和第六待文字识别...

【专利技术属性】
技术研发人员:石宝荣李屾王浩
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1