一种基于PSENet的圆形印章识别方法、设备及介质技术

技术编号:34945125 阅读:86 留言:0更新日期:2022-09-17 12:20
本发明专利技术提出一种基于PSENet的圆形印章识别方法、设备及介质。属于人工智能技术领域。实现步骤为:首先通过HSV色彩空间提取图像中的红色印章;然后通过计算连通域定位印章区域,去处印章边框;再通过PSENet定位印章中的文字位置;之后对文字进行旋转矫正;再对矫正后的文字进行OCR识别;最后进行文字排版分析。HSV色彩空间中,通道间的独立性更强,能更好反映印章的颜色特征,因此能够有效提取文档图像中的圆形印章;对印章内文字采用先校正方向再OCR识别的方案,能够有效提高印章文字的识别的准确率。的准确率。的准确率。

【技术实现步骤摘要】
一种基于PSENet的圆形印章识别方法、设备及介质


[0001]本专利技术属于人工智能
,具体涉及一种基于PSENet的圆形印章识别方法、设备及介质。

技术介绍

[0002]印章是最高法律效力的认证,是被用于官方公告、合同协议、证照文件等文档上的重要认证工具,包含发证机关等重要信息。印章识别是文档图像识别中的一个重要环节,准确提取并识别印章,对文档图像识别分析有着重要意义。而印章一般作为文档产生的最后一个环节,加印在文档空白区域或覆盖在文字区域之上,往往后者的情况更常见。因此,一方面,如何从文档图像,尤其是印章和文字重叠的图像中准确分离印章,是文档图像处理中的难点所在。另一方面,印章大多为圆形,其中的文字为环形排版,这也给印章文字识别带来了一定的难度。
[0003]常见的印章提取方式是基于图像色彩特征的方法,即利用印章的色彩特征。一种实现方式是,通过分析图像RGB色彩空间中红色通道与蓝、绿两通道间的差值,以提取构成印章的红色像素,但此方式比较依赖于差值阈值的选取。印章文字识别方面,常见的方式是对提取的印章进行特征点检测,与已有的印本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于PSENet的圆形印章识别方法,其特征在于:所述识别方法的步骤包括:步骤一,印章提取:通过HSV色彩空间特征提取文档图像中的红色印章像素;步骤二,印章定位,去除边框:通过计算红色像素区域的连通域范围定位印章区域,并去除印章边框;步骤三,文字位置定位:对于提取的印章图像,通过PSENet网络定位印章区域文字的边界框信息;步骤四,文字旋转矫正:根据步骤三的检测的文字边框信息,计算每个文字块的旋转角度,进行反向旋转,矫正文字的方向;步骤五,OCR识别:对步骤四矫正的文字块结果进行OCR识别,识别出文字内容;步骤六,文字排版分析:按照步骤三中得到的位置信息对文字块进行排版分析,分为两类:环形排版的发证机关内容,横向排版的印章名称内容,再组合步骤五的文字块识别结果。2.根据权利要求1所述的基于PSENet的圆形印章识别方法,其特征在于:所述步骤一具体为:将原始RGB色彩空间的图像转换为使用HSV色彩空间的表示,分析HSV分量的范围提取红色像素区域;其中,H通道的范围是0~10或156~180,S通道的范围是43~255,V通道的范围是46~255。3.根据权利要求1所述的基于PSENet的圆形印章识别方法,其特征在于:所述步骤二具体为:连通域是图像中相互连通的像素点所构成的最大区域,提取的红色区域中,边界范围最大的连通域即为印章边框所在区域,从而定位到印章区域,并得到印章的中心,在图像上的坐标信息表示为(x,y),将边框去除,仅保留印章内的文字。4.根据权利要求1所述的基于PSENet的圆形印章识别方法,其特征在于:步骤三具体为:通过PSENet定位的印章内文字块边界框信息表示为(x1,y1,x2,y2,x3,y3,x4,y4),其中(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)分别为文字块边界框左上角点、右上角点、右下角点和左下角点的坐标表示;计算文字...

【专利技术属性】
技术研发人员:杨乐赵阳宋进徐光洋曹兰天
申请(专利权)人:吉林省吉林祥云信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1