System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及场景文本识别,具体涉及一种印章图像识别方法和装置。
技术介绍
1、场景文字识别是指从自然场景中的图像或视频中检测和识别文字的技术。场景文字识别是计算机视觉和自然语言处理的交叉领域,具有重要的研究价值和广泛的应用场景,场景文字识别的主要难点包括文字的多样性、复杂性、变形性、遮挡性、低分辨率等。此外由于弯曲形状文字的变化更加复杂和多样,因此对弯曲形状文字的检测和识别也需要更高的鲁棒性和灵活性。
2、专利号为cn202310444555.4公开了一种印章图像的识别方法、装置、存储介质和电子设备,在该专利中将目标印章图像进行旋转矫正后,还需要将目标印章图像中的每个文字的坐标进行极坐标变换,以得到横向显示的图像,而在对目标印章图像进行极坐标变换时,无疑增加了图片信息丢失风险。此外,在该专利中获取图片旋转矫正角度时,也需要将图像对应的张量与预设线性空间张量进行内积运算,而预设线性空间张量l=[0,1,2,…,360]中具有361类张量,所以在得到旋转矫正角度时需要将图像对应的张量与预设线性空间张量中的361类张量进行内积运算时无疑增加了转正模型的开销。
3、基于此,需要一种新技术方案。
技术实现思路
1、有鉴于此,本专利技术实施例提供一种印章图像识别方法和装置,以至少解决现有的印章图像识别方法易造成图片信息丢失以及增加转正模型的开销的问题。
2、本专利技术实施例提供以下技术方案:
3、本专利技术实施例提供一种印章图像识别方法,包括:
4、获取待识别图片的印章位置信息,并基于所述印章位置信息获取印章裁切图片;
5、基于所述印章裁切图片和弯曲文字检测模型获取所述印章裁切图片中印章文字所处的闭合区域,其中,所述闭合区域包括所述印章文字的点坐标集合;
6、获取所述闭合区域的最小外接矩形,并基于所述最小外接矩形获取图片旋转角度,其中,所述图片旋转角度为所述最小外接矩形旋转至水平方向的角度;
7、根据所述图片旋转角度和转正检测模型旋转所述印章裁切图片获取转正识别图片,其中,在所述转正识别图片中,所述闭合区域的中轴线垂直于水平方向;
8、基于弯曲文字识别模型识别所述转正识别图片中的印章文字。
9、进一步地,所述获取待识别图片的印章位置信息,并基于所述印章位置信息获取印章裁切图片包括:
10、将所述待识别图片输入印章定位模型中,以获取所述印章位置信息,其中,所述印章位置信息包括印章的外切矩阵的顶点坐标;
11、基于所述印章位置信息裁切所述待识别图片,以获取所述印章裁切图片。
12、进一步地,所述获取所述闭合区域的最小外接矩形,并基于所述最小外接矩形获取图片旋转角度包括:
13、对所述印章裁切图片中闭合区域外部分进行掩码,并基于掩码后的所述印章裁切图片获取所述闭合区域的最小外接矩形;
14、基于所述最小外接矩形获取所述图片旋转角度。
15、进一步地,对所述印章裁切图片中闭合区域外部分进行掩码,并基于掩码后的所述印章裁切图片获取所述闭合区域的最小外接矩形包括:
16、基于所述闭合区域,将所述印章裁切图片中所述闭合区域外部分掩码成黑色;
17、基于所述闭合区域的点坐标集合获取所述闭合区域的凸包;
18、基于所述凸包获取凸包顶点坐标信息,并根据所述凸包顶点坐标信息获取凸包最小外接矩形;
19、将所述凸包最小外接矩形作为所述闭合区域的最小外接矩形。
20、进一步地,基于所述最小外接矩形获取所述图片旋转角度包括:
21、获取所述最小外接矩形的长边两顶点的顶点空间坐标;
22、根据两所述顶点空间坐标的坐标差获取所述图片旋转角度。
23、进一步地,根据所述图片旋转角度和转正检测模型旋转所述印章裁切图片获取转正识别图片包括:
24、根据所述图片旋转角度旋转所述印章裁切图片获取旋转识别图片;
25、基于所述转正检测模型对所述旋转识别图片进行转正检测,以获取所述印章文字的文字角度,其中,所述文字角度包括0°或180°;
26、基于所述文字角度旋转所述旋转识别图片,以获取转正识别图片。
27、进一步地,所述基于弯曲文字识别模型识别所述转正识别图片中的印章文字包括:
28、获取预训练文字识别模型和印章文字图片数据集,其中,所述印章文字图片数据集包括弯曲形状的文字;
29、基于所述印章文字图片数据集对所述预训练文字识别模型进行微调以获取所述弯曲文字识别模型;
30、将所述转正识别图片输入所述弯曲文字识别模型以识别所述印章文字。
31、本专利技术还提供了一种印章图像识别装置,包括:
32、印章定位模块,所述印章定位模块用于定位待识别图片中的印章位置信息,并基于所述印章位置信息获取印章裁切图片;
33、印章文字检测模块,所述印章文字检测模块用于基于所述印章裁切图片和弯曲文字检测模型获取所述印章裁切图片中印章文字所处的闭合区域,其中,所述闭合区域包括所述印章文字的点坐标集合;
34、印章文字区域旋转计算模块,所述印章文字区域旋转计算模块用于获取所述闭合区域的最小外接矩形,并基于所述最小外接矩形获取图片旋转角度,其中,所述图片旋转角度为所述最小外接矩形旋转至水平方向的角度;
35、印章文字区域转正检测模块,所述印章文字区域转正检测模块用于根据所述图片旋转角度和转正检测模型旋转所述印章裁切图片获取转正识别图片,其中,在所述转正识别图片中,所述闭合区域的中轴线垂直于水平方向;
36、印章文字识别模块,所述印章文字识别模块用于基于弯曲文字识别模型识别所述转正识别图片中的印章文字。
37、本专利技术还提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上任一项所述的印章图像识别方法。
38、本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上任一项所述的印章图像识别方法。
39、与现有技术相比,本专利技术实施例采用的上述至少一个技术方案能够达到的有益效果至少包括:
40、(1)本专利技术的一种印章图像识别方法,在文字检测方面,可以检测弯曲形状文字,不受限于文字区域的形状,相比于现有技术更具有适用性;
41、(2)本专利技术在文字识别方面,使用计算文字区域最小外接矩形与转正检测模型,替代旋转矫正模型,减少模型误差率、计算开销更小;同时不使用极坐标变换,减少了计算变换可能带来的信息丢失,识别精度更高、更具有适用性,决了现有的印章图像识别方法易造成图片信息丢失以及增加转正模型的开销的问题。
本文档来自技高网...【技术保护点】
1.一种印章图像识别方法,其特征在于,包括:
2.根据权利要求1所述的印章图像识别方法,其特征在于,所述获取待识别图片的印章位置信息,并基于所述印章位置信息获取印章裁切图片包括:
3.根据权利要求1所述的印章图像识别方法,其特征在于,所述获取所述闭合区域的最小外接矩形,并基于所述最小外接矩形获取图片旋转角度包括:
4.根据权利要求3所述的印章图像识别方法,其特征在于,对所述印章裁切图片中闭合区域外部分进行掩码,并基于掩码后的所述印章裁切图片获取所述闭合区域的最小外接矩形包括:
5.根据权利要求3所述的印章图像识别方法,其特征在于,基于所述最小外接矩形获取所述图片旋转角度包括:
6.根据权利要求1所述的印章图像识别方法,其特征在于,所述基于弯曲文字识别模型识别所述转正识别图片中的印章文字包括:
7.一种印章图像识别装置,其特征在于,包括:
8.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并能够在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6中任一项所述的印章图像识别方法。
...【技术特征摘要】
1.一种印章图像识别方法,其特征在于,包括:
2.根据权利要求1所述的印章图像识别方法,其特征在于,所述获取待识别图片的印章位置信息,并基于所述印章位置信息获取印章裁切图片包括:
3.根据权利要求1所述的印章图像识别方法,其特征在于,所述获取所述闭合区域的最小外接矩形,并基于所述最小外接矩形获取图片旋转角度包括:
4.根据权利要求3所述的印章图像识别方法,其特征在于,对所述印章裁切图片中闭合区域外部分进行掩码,并基于掩码后的所述印章裁切图片获取所述闭合区域的最小外接矩形包括:
5.根据权利要求3所述的印章图像识别方法,其特征在于,基于所...
【专利技术属性】
技术研发人员:俞飞阳,臧凯强,王盼龙,
申请(专利权)人:哪吒港航智慧科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。