一种方形姓名印章文字提取、检测识别方法及系统技术方案

技术编号:33340762 阅读:21 留言:0更新日期:2022-05-08 09:26
本发明专利技术公开了一种一种方形姓名印章文字提取、检测识别方法,该方法包括如下步骤:面向复杂环境的方形姓名印章提取;获取含有方形姓名印章的图片或文档扫描件;对处理后的图片或文档扫描件进行神经网络分类;从神经网络返回结果确定待识别目标的几何特征;获得只含有方形姓名印章的图片文件;将初步转正图片,和旋转了90度的初步转正图片分别进行OCR检测;比较S21中OCR检测后的两者图片的返回值;将S22获得的返回值较好图片,和旋转了180度的返回值较好图片分别进行OCR检测。本发明专利技术解决了方形姓名章难以识别的问题;对OCR系统的宽容度很高,无需额外训练或调整,节省了人力物力,大大提高了工作效率。大提高了工作效率。大提高了工作效率。

【技术实现步骤摘要】
一种方形姓名印章文字提取、检测识别方法及系统


[0001]本专利技术涉及印章文字识别方法领域,尤其涉及一种基于含有姓名印章的文档扫描图片的OCR文字识别方法及对应系统。

技术介绍

[0002]随着社会的发展,印章使用越来越频繁,各级国家机关、社会团体、高校以及企事业单位用都会用到印章,如何识别印章上的文字也变得越来越重要。
[0003]当今社会,还没有针对印章文字检测的成熟的、通用的算法。现有解决方案多是基于一个给定情境,对特定图章进行检定与文字识别,对文字识别系统有较高的需求,一般需要对文字识别系统进行额外的训练;且多数针对的是圆形公章,没有针对方形姓名章、法人章的成型方法。
[0004]另外,目前并不存在能对印章进行直接识别的OCR以及NLP软件或算法,导致当前对印章的处理强烈依赖于人工识别,增加了人力物力,且无法实现自动化流程。又因为印章出现的多是单个无意义文字,而且印章的旋转角度不定,加之印章的面积有限,导致即使是人工识别也不能达到较高的效率与准确度。当有大量业务出现时,现有的处理方法无法有效的进行应对。

技术实现思路

[0005]本申请提供了一种方形姓名印章文字提取、检测识别方法及系统,是一种面向复杂环境的方形姓名印章文字检测识别方法、装置、电子设备及计算机可读存储介质,在存在背景文本或杂色的干扰下,对印章中的文字与数字进行识别。
[0006]本专利技术是通过以下技术方案实现的:
[0007]本专利技术的第一个目的,是提供一种方形姓名印章文字提取、检测识别方法,该方法包括如下步骤:
[0008]S1.面向复杂环境的方形姓名印章提取;
[0009]S11.获取含有方形姓名印章的图片或文档扫描件,对图片进行色彩提取与二值化处理,得到二值图像;
[0010]S12.对处理后的图片或文档扫描件进行神经网络分类,判断所含印章是否为本方法所适用的,对于分类结果适用本方法的图片或扫描件,进行后续处理;
[0011]S13.从神经网络返回结果确定待识别目标的几何特征,利用方形姓名印章的几何特征与色彩特征确定最小外接矩形;
[0012]S14.根据外接最小矩形进行方形姓名印章的旋转与切割,通过投影变换将最小外接矩形内的像素重新映射到新的正方形画布,获得只含有方形姓名印章的图片文件;
[0013]S2.基于OCR返回值的方形姓名印章文字检测识别;
[0014]S21.将初步转正图片,和旋转了90度的初步转正图片分别进行OCR检测,两图片分别称为图片A与图片B;
[0015]S22.比较S21中OCR检测后的图片A与图片B的返回值,包括文本内容、文本角度、置信度,选取返值中文本内容较长、置信度较高, 或其他可以认为返回值较好的图片作为下一步处理的依据,称此图片为图片C;
[0016]S23.保留S22中获得的图片C及其识别结果,将图片C进行180 度旋转,称为图片D,旋转过后的图片D再次进行OCR检测;
[0017]S24.比较S22与S23中OCR检测后的图片C与图片D的返回值,与S22类似的选取返回值较好的图片作为转正图片,称为图片S,由图片S的识别结果得到方形姓名印章的数字内容;
[0018]S25.对S24中得到的转正图片S进行固定模式的切割,得到切割图片;
[0019]S26.对S25中的切割图片分别进行OCR识别,得到返回值;
[0020]S27.对所得所有OCR返回值text字段(即识别到的文本内容) 中的数字与中文字符依照与S25相对应的规则进行合并,得到方形姓名印章的文字识别结果。
[0021]作为优选实施例,所述S12之前增加步骤:对所述S11中的二值图像进行开操作、闭操作,去除小的噪点,保留最大连通域。
[0022]作为优选实施例,所述S12中的神经网络分类,是使用卷积神经网络进行分类,模型采用AlexNet,torch顺序结构搭建,交叉熵函数和SGD随机梯度下降,由于AlexNet的设计是进行224
×
224大小图像的分类,因而需要使用OpenCV对图像进行分类,在进行分类时,不同维度的处理可能会导致原有印章发生形变,从而导致分类的准确度不高,因而使用空间金字塔池化来取代部分池化层,从而极大的提高了分类的准确度。
[0023]作为优选实施例,对神经网络分类的分类器采用卷积神经网络 CNN,使用AlexNet网络模型,torch顺序结构,交叉熵函数和SGD 随机梯度下降,神经网络采用约4000张含有圆形、椭圆形与矩形印章的训练集进行训练,可以对印章是否为矩形印章进行准确的分类。
[0024]作为优选实施例,所述S13采用将提取框做一次投影变换,以最小旋转角映射到250*250的新画布上,即得到目标方形印章的提取图片。
[0025]作为优选实施例,所述S21中的初步转正图片,并非一般意义上的0度位置图片,而是指对于目标OCR系统而言识别效果最好的一张图片,由于OCR一般以0度文字为基准,推测其0度识别情况最好,因而称识别效果最好的图片为转正图片;但实际情况根据OCR系统与图片的不同,会出现其他角度识别情况比0度更好的情况,此时的转正图片为识别情况最好的非0度图片。
[0026]作为优选实施例,如果OCR的服务不是本地部署的,则还需要网络连接一台远程服务器,由远程服务器部署OCR服务。
[0027]本专利技术的第二个目的,是提供一种方形姓名印章文字提取、检测识别的系统,该系统包括:
[0028]图片获取模块,用于获取含有印章的图片或文档扫描件;
[0029]图片处理模块,用于对图片进行色彩提取,二值化处理与最大连通域提取;
[0030]印章分类模块,用于对上述文档或扫描件进行分类,判断所含印章是否为本方法所适用的,对于分类结果适用本方法的图片或扫描件,进行后续处理;
[0031]印章定位模块,用于从神经网络返回结果确定目标在图像中的具体位置,利用方形的几何特征确定外接最小矩形;
[0032]印章提取模块,用于根据外接最小矩形,通过投影变换进行方型印章的旋转与切割,获得只含有印章的图片文件;
[0033]光学文字识别模块,用于从图像中获取对应的文字信息;
[0034]图像处理模块,用于图像旋转与切割;
[0035]文字提取模块,用于OCR返回结果的提取与规则化。
[0036]本专利技术的第三个目的,是提供一种电子设备,所述电子设备包括:处理器、存储器,所述处理器和存储器均至少包括一个,所述处理器和存储器之间通信连接,所述存储器存储有可被所述处理器执行的指令,所述处理器执行所述指令,以实现如上所述方形姓名印章文字提取、检测识别方法的步骤。
[0037]本专利技术的实现原理:一种印章识别的思路是,根据印章本身的性质进行识别。由于印章颜色的特殊性,可以根据整个扫描文档中的特殊颜色来进行识别;亦可以通过印章的几何形状边框进行识别。这便引入了本专利技术的技术背景:
...

【技术保护点】

【技术特征摘要】
1.一种方形姓名印章文字提取、检测识别方法,其特征在于,该方法包括如下步骤:S1.面向复杂环境的方形姓名印章提取;S11.获取含有方形姓名印章的图片或文档扫描件,对图片进行色彩提取与二值化处理,得到二值图像;S12.对处理后的图片或文档扫描件进行神经网络分类,判断所含印章是否为本方法所适用的,对于分类结果适用本方法的图片或扫描件,进行后续处理;S13.从神经网络返回结果确定待识别目标的几何特征,利用方形姓名印章的几何特征与色彩特征确定最小外接矩形;S14.根据外接最小矩形进行方形姓名印章的旋转与切割,通过投影变换将最小外接矩形内的像素重新映射到新的正方形画布,获得只含有方形姓名印章的图片文件;S2.基于OCR返回值的方形姓名印章文字检测识别;S21.将初步转正图片,和旋转了90度的初步转正图片分别进行OCR检测,两图片分别称为图片A与图片B;S22.比较S21中OCR检测后的图片A与图片B的返回值,包括文本内容、文本角度、置信度,选取返值中文本内容较长、置信度较高,或其他可以认为返回值较好的图片作为下一步处理的依据,称此图片为图片C;S23.保留S22中获得的图片C及其识别结果,将图片C进行180度旋转,称为图片D,旋转过后的图片D再次进行OCR检测;S24.比较S22与S23中OCR检测后的图片C与图片D的返回值,与S22类似的选取返回值较好的图片作为转正图片,称为图片S,由图片S的识别结果得到方形姓名印章的数字内容;S25.对S24中得到的转正图片S进行固定模式的切割,得到切割图片;S26.对S25中的切割图片分别进行OCR识别,得到返回值;S27.对所得所有OCR返回值text字段(即识别到的文本内容)中的数字与中文字符依照与S25相对应的规则进行合并,得到方形姓名印章的文字识别结果。2.根据权利要求1所述的一种方形姓名印章文字提取、检测识别方法,其特征在于,所述S12之前增加步骤:对所述S11中的二值图像进行开操作、闭操作,去除小的噪点,保留最大连通域。3.根据权利要求1所述的一种方形姓名印章文字提取、检测识别方法,其特征在于,所述S12中的神经网络分类,是使用卷积神经网络进行分类,模型采用AlexNet,torch顺序结构搭建,交叉熵函数和SGD随机梯度下降,由于AlexNet的设计是进行224
×
224大小图像的分类,因而需要使用OpenCV对图像进行分类,在进行分类时,不同维度的处理可能会导致原有印章发生形变,从而导致分类的准确度不高,...

【专利技术属性】
技术研发人员:顾俊杰武星陈成钟鸣宇
申请(专利权)人:上海深豹智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1