一种基于图章轮廓的弯曲文字拉平识别方法和装置制造方法及图纸

技术编号：32501615 阅读：17 留言：0更新日期：2022-03-02 10:10

本申请公开了一种基于图章轮廓的弯曲文字拉平识别方法。在图像中检测图章，得到图章区域。利用圆或椭圆检测算法在图章区域中进行检测。对检测到的圆形图章，获取圆形图章上的多条线段；将所有线段紧挨着平行排列，组成的矩形图像就作为圆形图章展平后的图章图片。对检测到的椭圆形图章，获取椭圆形图章上的多条线段；将所有线段紧挨着平行排列，并且缩放各条线段以使长度相同，所组成的矩形图像就作为椭圆形图章展平后的图章图片。对展平的图章图片进行文字检测，再对检测出的文字进行光学字符识别得到文字识别结果。本申请仅需对一列列像素点进行处理，运算效率更高，运算速度更快，对硬件计算资源的要求更低。对硬件计算资源的要求更低。对硬件计算资源的要求更低。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图章轮廓的弯曲文字拉平识别方法和装置

[0001]本申请涉及一种图章图像中弯曲文字的拉平和识别方法。

技术介绍

[0002]文档图像中可能包含有图章(也称印章)，在文档图像中识别和提取文字信息时，就需要从图章图像中识别和提取文字信息。图章的轮廓有圆形、椭圆形、矩形等。请参阅图1和图2，这是两个椭圆形图章，图章中的文字既包含沿着图章轮廓排列的弯曲文字，也包含沿着直线排列的正常文字；正常文字可能有一行或多行。现有OCR(Optical Character Recognition，光学字符识别)技术能够较好地检测和识别出沿着直线排列的正常文字，但是对沿着图章轮廓排列的弯曲文字的检测和识别较差，这给图章中弯曲文字的识别和提取带来挑战。
[0003]申请公布号为CN110728277A、申请公布日为2020年1月24日的中国专利技术专利申请《一种印章智能检测与识别的方法》公开了一种将印章中的文字区域变换拉平后识别文字区域、输出对应文字的技术方案。该方案仅记载了“将弧形的文字区域拉平”，并未说明采用了什么圆或椭圆检测算法。

技术实现思路

[0004]本申请所要解决的技术问题是提出一种基于图章轮廓展平文字后再进行识别的方法，既提高了图章文字的易阅读性，又降低了图章文字的识别难度。
[0005]为解决上述技术问题，本申请提出了一种基于图章轮廓的弯曲文字拉平识别方法，包括如下步骤。步骤S10：在图像中检测图章，得到图章区域。步骤S20：利用圆或椭圆检测算法在图章区域中进行检测。如果在图章区域中检...

【技术保护点】

【技术特征摘要】
1.一种基于图章轮廓的弯曲文字拉平识别方法，其特征是，包括如下步骤；步骤S10：在图像中检测图章，得到图章区域；步骤S20：利用圆或椭圆检测算法在图章区域中进行检测；如果在图章区域中检测出圆，通过所述圆检测算法获得圆心位置，进入步骤S30；如果在图章区域中检测出椭圆，通过所述椭圆检测算法获得两个焦点位置，进入步骤S35；如果在图章区域中未检测出圆或椭圆，进入步骤S40，此时图章区域就作为展平的图章图片；步骤S30：对检测到的圆形图章，获取圆形图章上的多条线段；使用布雷森汉姆直线算法获得每条线段上的所有像素点；将所有线段紧挨着平行排列，相互平行的多条线段所组成的矩形图像就作为圆形图章展平后的图章图片；每条线段上的所有像素点就作为矩形图像的一列像素点，然后进入步骤S40；步骤S35：对检测到的椭圆形图章，获取椭圆形图章上的多条线段；使用布雷森汉姆直线算法获得每条线段上的所有像素点；将所有线段紧挨着平行排列，并且缩放各条线段以使各条线段的长度相同，相互平行的多条线段所组成的矩形图像就作为椭圆形图章展平后的图章图片；缩放后的每条线段上的所有像素点就作为矩形图像的一列像素点，然后进入步骤S40；步骤S40：对展平的图章图片进行文字检测，再对检测出的文字进行光学字符识别得到文字识别结果。2.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法，其特征是，所述步骤S10中，采用通用目标检测方法在图像中检测图章。3.根据权利要求2所述的基于图章轮廓的弯曲文字拉平识别方法，其特征是，所述通用目标检测方法是你只看一次YOLO算法。4.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法，其特征是，所述步骤S20中，所述圆或椭圆检测算法是EDCircles算法。5.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法，其特征是，所述步骤S30中，圆形图章上的多条线段的获取方式为：以图章的圆形轮廓上的任意一点为起始点，将圆心与该起始点连接构成第一条线段；以圆心为固定点，将第一条线段沿着顺时针或逆时针每隔固定的α角度转动一次，依次得到第二条线段、第三条线段、
……
。6.根据权利要求1所述的基于图章轮廓的弯曲文字拉平识别方法，其特征是，所述步骤S35中，椭圆形图章上的多条线段的获取方式为：(a)以图章的椭圆形轮廓的一个焦点与距离该焦点最近的长轴端点连接构成第一条线段；假设所有线段的总数为k条，k必然为偶数；椭圆的两个焦点之间的距离为d；(b)将第一条线段先沿着椭圆的长轴向另一个焦点的方向平移2d/k的距离，然后将平移后的第一条线段在椭圆的长轴上的端点作为固定点，沿着顺时针或逆时针方向转动固定的α角度，并延长或缩短另一个端点直至与图章的椭圆形轮廓相交即得到第二条线段；平移与转动或者互换顺序，或者同时进行；将第二条线段先沿着椭圆的长轴向另一个焦点的方向平移2d/k的距离，然后将平移后的第二条线段在椭圆的长轴上的端点作为固定点，沿着与之前相同的方向转动固定的α角度，并延长或缩短另一个端点直至与图章的椭圆形轮廓
...

【专利技术属性】
技术研发人员：刘鹏伟，郭丰俊，龙腾，丁凯，张彬，镇立新，
申请(专利权)人：上海临冠数据科技有限公司上海生腾数据科技有限公司上海盈五蓄数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人