一种基于图章轮廓的弯曲文字拉平识别方法和装置制造方法及图纸

技术编号:32501615 阅读:17 留言:0更新日期:2022-03-02 10:10
本申请公开了一种基于图章轮廓的弯曲文字拉平识别方法。在图像中检测图章,得到图章区域。利用圆或椭圆检测算法在图章区域中进行检测。对检测到的圆形图章,获取圆形图章上的多条线段;将所有线段紧挨着平行排列,组成的矩形图像就作为圆形图章展平后的图章图片。对检测到的椭圆形图章,获取椭圆形图章上的多条线段;将所有线段紧挨着平行排列,并且缩放各条线段以使长度相同,所组成的矩形图像就作为椭圆形图章展平后的图章图片。对展平的图章图片进行文字检测,再对检测出的文字进行光学字符识别得到文字识别结果。本申请仅需对一列列像素点进行处理,运算效率更高,运算速度更快,对硬件计算资源的要求更低。对硬件计算资源的要求更低。对硬件计算资源的要求更低。

【技术实现步骤摘要】
一种基于图章轮廓的弯曲文字拉平识别方法和装置


[0001]本申请涉及一种图章图像中弯曲文字的拉平和识别方法。

技术介绍

[0002]文档图像中可能包含有图章(也称印章),在文档图像中识别和提取文字信息时,就需要从图章图像中识别和提取文字信息。图章的轮廓有圆形、椭圆形、矩形等。请参阅图1和图2,这是两个椭圆形图章,图章中的文字既包含沿着图章轮廓排列的弯曲文字,也包含沿着直线排列的正常文字;正常文字可能有一行或多行。现有OCR(Optical Character Recognition,光学字符识别)技术能够较好地检测和识别出沿着直线排列的正常文字,但是对沿着图章轮廓排列的弯曲文字的检测和识别较差,这给图章中弯曲文字的识别和提取带来挑战。
[0003]申请公布号为CN110728277A、申请公布日为2020年1月24日的中国专利技术专利申请《一种印章智能检测与识别的方法》公开了一种将印章中的文字区域变换拉平后识别文字区域、输出对应文字的技术方案。该方案仅记载了“将弧形的文字区域拉平”,并未说明采用了什么圆或椭圆检测算法。

技术实现思路

[0004]本申请所要解决的技术问题是提出一种基于图章轮廓展平文字后再进行识别的方法,既提高了图章文字的易阅读性,又降低了图章文字的识别难度。
[0005]为解决上述技术问题,本申请提出了一种基于图章轮廓的弯曲文字拉平识别方法,包括如下步骤。步骤S10:在图像中检测图章,得到图章区域。步骤S20:利用圆或椭圆检测算法在图章区域中进行检测。如果在图章区域中检测出圆,通过所述圆检测算法获得圆心位置,进入步骤S30。如果在图章区域中检测出椭圆,通过所述椭圆检测算法获得两个焦点位置,进入步骤S35。如果在图章区域中未检测出圆或椭圆,进入步骤S40,此时图章区域就作为展平的图章图片。步骤S30:对检测到的圆形图章,获取圆形图章上的多条线段;使用布雷森汉姆直线算法获得每条线段上的所有像素点;将所有线段紧挨着平行排列,相互平行的多条线段所组成的矩形图像就作为圆形图章展平后的图章图片;每条线段上的所有像素点就作为矩形图像的一列像素点,然后进入步骤S40。步骤S35:对检测到的椭圆形图章,获取椭圆形图章上的多条线段;使用布雷森汉姆直线算法获得每条线段上的所有像素点;将所有线段紧挨着平行排列,并且缩放各条线段以使各条线段的长度相同,相互平行的多条线段所组成的矩形图像就作为椭圆形图章展平后的图章图片;缩放后的每条线段上的所有像素点就作为矩形图像的一列像素点,然后进入步骤S40。步骤S40:对展平的图章图片进行文字检测,再对检测出的文字进行光学字符识别得到文字识别结果。上述方法并不是对图章图像的区域进行拉伸,而是对图章图像进行采样(获取多条线段,每条线段的宽度均为一个像素点),再对多条线段进行展平(紧挨着平行排列),这种仅对线段进行处理的方式仅需对一列列像素点进行处理,与对某个图像区域处理相比,运算效率更高,运算速度更快,
对硬件计算资源的要求更低。
[0006]进一步地,所述步骤S10中,采用通用目标检测方法在图像中检测图章。
[0007]优选地,所述通用目标检测方法是你只看一次YOLO算法。
[0008]优选地,所述步骤S20中,所述圆或椭圆检测算法是EDCircles算法。
[0009]进一步地,所述步骤S30中,圆形图章上的多条线段的获取方式为:以图章的圆形轮廓上的任意一点为起始点,将圆心与该起始点连接构成第一条线段;以圆心为固定点,将第一条线段沿着顺时针或逆时针每隔固定的α角度转动一次,依次得到第二条线段、第三条线段、
……

[0010]进一步地,所述步骤S35中,椭圆形图章上的多条线段的获取方式为:(a)以图章的椭圆形轮廓的一个焦点与距离该焦点最近的长轴端点连接构成第一条线段;假设所有线段的总数为k条,k必然为偶数;椭圆的两个焦点之间的距离为d。(b)将第一条线段先沿着椭圆的长轴向另一个焦点的方向平移2d/k的距离,然后将平移后的第一条线段在椭圆的长轴上的端点作为固定点,沿着顺时针或逆时针方向转动固定的α角度,并延长或缩短另一个端点直至与图章的椭圆形轮廓相交即得到第二条线段;平移与转动或者互换顺序,或者同时进行;将第二条线段先沿着椭圆的长轴向另一个焦点的方向平移2d/k的距离,然后将平移后的第二条线段在椭圆的长轴上的端点作为固定点,沿着与之前相同的方向转动固定的α角度,并延长或缩短另一个端点直至与图章的椭圆形轮廓相交得到第三条线段;平移与转动或者互换顺序,或者同时进行;以此类推,直至得到第k/2条线段,第k/2条线段与第一条线段都在椭圆的长轴上。(c)将第k/2条线段先沿着椭圆的长轴向初始焦点的方向平移2d/k的距离,然后将平移后的第k/2条线段在椭圆的长轴上的端点作为固定点,沿着与之前相同的方向转动固定的α角度,并延长或缩短另一个端点直至与图章的椭圆形轮廓相交得到第k/2+1条线段;平移与转动或者互换顺序,或者同时进行;将第k/2+1条线段先沿着椭圆的长轴向初始焦点的方向平移2d/k的距离,然后将平移后的第k/2+1条线段在椭圆的长轴上的端点作为固定点,沿着与之前相同的方向转动固定的α角度,并延长或缩短另一个端点直至与图章的椭圆形轮廓相交得到第k/2+2条线段;平移与转动或者互换顺序,或者同时进行;以此类推,直至得到第k条线段。
[0011]进一步地,α≤1度。
[0012]进一步地,在能整除的情况下,一个圆形或椭圆形图章中的所有线段的总数为360/α条。
[0013]优选地,所述步骤S40中,采用高效精确的场景文字检测器EAST算法进行文字检测。
[0014]进一步地,所述步骤S40中,如果在展平的图章图片中某一行检测到两段不连续的文字,将左边一段文字拼接到右边一段文字的末尾,将拼接后的文字行通过光学字符识别得到文字识别结果。
[0015]本申请还提出了一种基于图章轮廓的弯曲文字拉平识别装置,包括图章检测单元、圆或椭圆检测单元、圆形拉平单元、椭圆形拉平单元、以及字符识别单元。所述图章检测单元用于在图像中检测图章,得到图章区域。所述圆或椭圆检测单元用于利用圆或椭圆检测算法在图章区域中进行检测;如果在图章区域中检测出圆,通过所述圆检测算法获得圆心位置,送入圆形拉平单元;如果在图章区域中检测出椭圆,通过所述椭圆检测算法获得两
个焦点位置,送入椭圆形拉平单元;如果在图章区域中未检测出圆或椭圆,送入字符识别单元,此时图章区域就作为展平的图章图片。所述圆形拉平单元用于对检测到的圆形图章获取圆形图章上的多条线段;使用布雷森汉姆直线算法获得每条线段上的所有像素点;将所有线段紧挨着平行排列,相互平行的多条线段所组成的矩形图像就作为圆形图章展平后的图章图片;每条线段上的所有像素点就作为矩形图像的一列像素点,然后送入字符识别单元。所述椭圆形拉平单元用于对检测到的椭圆形图章获取椭圆形图章上的多条线段;使用布雷森汉姆直线算法获得每条线段上的所有像素点;将所有线段紧挨着平行排列,并且缩放各条线段以使各条线段的长度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图章轮廓的弯曲文字拉平识别方法,其特征是,包括如下步骤;步骤S10:在图像中检测图章,得到图章区域;步骤S20:利用圆或椭圆检测算法在图章区域中进行检测;如果在图章区域中检测出圆,通过所述圆检测算法获得圆心位置,进入步骤S30;如果在图章区域中检测出椭圆,通过所述椭圆检测算法获得两个焦点位置,进入步骤S35;如果在图章区域中未检测出圆或椭圆,进入步骤S40,此时图章区域就作为展平的图章图片;步骤S30:对检测到的圆形图章,获取圆形图章上的多条线段;使用布雷森汉姆直线算法获得每条线段上的所有像素点;将所有线段紧挨着平行排列,相互平行的多条线段所组成的矩形图像就作为圆形图章展平后的图章图片;每条线段上的所有像素点就作为矩形图像的一列像素点,然后进入步骤S40;步骤S35:对检测到的椭圆形图章,获取椭圆形图章上的多条线段;使用布雷森汉姆直线算法获得每条线段上的所有像素点;将所有线段紧挨着平行排列,并且缩放各条线段以使各条线段的长度相同,相互平行的多条线段所组成的矩形图像就作为椭圆形图章展平后的图章图片;缩放后的每条线段上的所有像素点就作为矩形图像的一列像素点,然后进入步骤S40;步骤S40:对展平的图章图片进行文字检测,再对检测出的文字进行光学字符识别得到文字识别结果。2.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法,其特征是,所述步骤S10中,采用通用目标检测方法在图像中检测图章。3.根据权利要求2所述的基于图章轮廓的弯曲文字拉平识别方法,其特征是,所述通用目标检测方法是你只看一次YOLO算法。4.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法,其特征是,所述步骤S20中,所述圆或椭圆检测算法是EDCircles算法。5.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法,其特征是,所述步骤S30中,圆形图章上的多条线段的获取方式为:以图章的圆形轮廓上的任意一点为起始点,将圆心与该起始点连接构成第一条线段;以圆心为固定点,将第一条线段沿着顺时针或逆时针每隔固定的α角度转动一次,依次得到第二条线段、第三条线段、
……
。6.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法,其特征是,所述步骤S35中,椭圆形图章上的多条线段的获取方式为:(a)以图章的椭圆形轮廓的一个焦点与距离该焦点最近的长轴端点连接构成第一条线段;假设所有线段的总数为k条,k必然为偶数;椭圆的两个焦点之间的距离为d;(b)将第一条线段先沿着椭圆的长轴向另一个焦点的方向平移2d/k的距离,然后将平移后的第一条线段在椭圆的长轴上的端点作为固定点,沿着顺时针或逆时针方向转动固定的α角度,并延长或缩短另一个端点直至与图章的椭圆形轮廓相交即得到第二条线段;平移与转动或者互换顺序,或者同时进行;将第二条线段先沿着椭圆的长轴向另一个焦点的方向平移2d/k的距离,然后将平移后的第二条线段在椭圆的长轴上的端点作为固定点,沿着与之前相同的方向转动固定的α角度,并延长或缩短另一个端点直至与图章的椭圆形轮廓
...

【专利技术属性】
技术研发人员:刘鹏伟郭丰俊龙腾丁凯张彬镇立新
申请(专利权)人:上海临冠数据科技有限公司上海生腾数据科技有限公司上海盈五蓄数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1