当前位置: 首页 > 专利查询>西南大学专利>正文

一种文本倾斜角度检测方法、系统及存储介质技术方案

技术编号:30546148 阅读:21 留言:0更新日期:2021-10-30 13:24
本发明专利技术提供一种文本倾斜角度检测方法、系统及存储介质,所述检测方法包括对原始文本图像进行的归一化预处理;所述归一化预处理包括:通过前景灰度阈值和背景灰度阈值对所述原始文本图像进行分区,其后进行分区归一化;其中,所述前景灰度阈值和/或所述背景灰度阈值通过局部阈值法获得的局部灰度阈值与灰度标准差综合得到。本发明专利技术可对不同质量表现的文本图像、尤其是具有噪声干扰的文本图像进行精准的倾斜角度检测,进一步的,该方法可在360

【技术实现步骤摘要】
一种文本倾斜角度检测方法、系统及存储介质


[0001]本专利技术涉及计算机视觉图像处理
,尤其涉及基于深度学习的计算机视觉图像处理技术。

技术介绍

[0002]文本倾斜角度的检测在文本识别的预处理步骤中起着至关重要的作用。研究表明,将没有文本倾斜角度检测的文本识别系统直接应用于带有倾斜角度的文档的识别中时,系统的识别率将大大降低,因此,快速而准确的文本倾斜角度的检测是有必要的。
[0003]最常用的文本倾斜角度的检测方法是基于投影的文本倾斜检测,它通过不断的旋转图像,并分析旋转后的图像的投影来确定图像的倾斜角度,这种方法计算量巨大且对于偏转了特殊角度(例如
±
90
°

±
180
°
)的图像不能进行准确检测,获得准确的偏转角度;另一种常见的检测方法为基于霍夫变换的文档倾斜角度检测,该方法通过检测文档的直线,并且将直线的坐标从笛卡尔坐标系转换为极坐标系的方式很好的实现了90
°
倾斜角度的检测,但是这种方法对于图像的质量要求较高,如果是简单的纯文本的扫描图像能够很好的工作,对于自然场景下的带有噪声的文档该算法的性能就会急剧下降。
[0004]近些年来,机器学习尤其是深度学习的快速发展,给了文档倾斜角度的检测一种新思路,如现有技术中提出了通过一个360分类的卷积神经网络来将角度检测问题转换为一个分类问题的手段,但是,这种方法需要巨量的且必须是精心设计的原始样本才能使分类器有一个很好分类的效果,而且,该分类器的检测精准度为1
°
,在某些场景下,这样的精准度是不够的。

技术实现思路

[0005]本专利技术的目的在于克服现有技术中的缺点,提供一种可对不同质量表现的文本图像、尤其是具有噪声干扰的文本图像进行精准的倾斜角度检测的方法,进一步的,该方法可在360
°
范围内对文本倾斜角度进行精度达到0.2
°
的检测,提取并确定文本行的精确位置。
[0006]本专利技术的目的还在于提供上述检测方法的一种高效实现系统及其存储介质。
[0007]本专利技术首先提供了以下技术方案:
[0008]一种文本倾斜角度检测方法,其包括:对原始文本图像进行归一化预处理;所述归一化预处理包括:通过前景灰度阈值和背景灰度阈值对所述原始文本图像进行分区,其后进行分区归一化;其中,所述前景灰度阈值和/或所述背景灰度阈值通过局部阈值法获得的局部灰度阈值与灰度标准差综合得到。
[0009]相对于现有技术中直接使用全局或局部阈值,而难以将像素进行前景或背景分配的技术手段,本专利技术的上述技术方案为软分配方案,可取代直接二值化的硬分配,更好地减少噪声干扰,提高目标文本行的提取精度。
[0010]进一步的,所述检测方法还包括:对经过所述归一化预处理后的文本图像进行增强处理。
[0011]该进一步的方案中,所述增强处理是指的可提高图像整体和/或局部和/或边缘等处的清晰度、完整度、可识别度、对比度、可提取度等性能的处理方式,如对图像进行的形态学操作。
[0012]该进一步的方案可提高目标文本行的提取准确性,以得到更准确的检测结果,并可减少后续处理的误差性。
[0013]进一步的,所述检测方法还包括:对经过所述归一化预处理后的文本图像,或经过所述归一化预处理并进一步进行增强处理后的文本图像进行目标提取及目标区域位置标注。
[0014]该进一步的方案中,所述目标提取是指的自文本图像中获得待检测文本行或更具体的,待检测的每个字体的过程,其可选用如最小外接矩形框检测算法等实现;所述目标区域位置标注是指的标注或记录可表明目标文本行或目标字体在图像中的位置的标识,该标识可如进行定位的一组或多组坐标。
[0015]通过该进一步的方案,可直接自归一化预处理或归一化并增强预处理后的图像中提取出待检测的文本,提升了其后的检测精度,并减少了检测工作量和检测误差。
[0016]进一步的,所述检测方法还包括:对经过所述目标提取及目标区域位置标注后获得的目标图像进行倾斜角度检测;所述倾斜角度检测包括以下过程:
[0017]在顺时针为负,逆时针为正的坐标系下:
[0018]根据文本与竖直正方向的夹角,确定其是朝上还是朝下,并将其中确定为朝下的文本进行第一旋转角角度为+180
°


180
°
的第一旋转,使其转换为朝上;其中,与竖直正方向的夹角为(

90
°
,+90
°
)范围的文本标记为朝上,夹角为[

180
°


90
°
)或(+90
°
,+180
°
]范围的文本标记为朝下;
[0019]在经过所述第一旋转后,进一步根据文本与竖直正方向的夹角,确定其是朝左、朝右还是朝上,并将其中朝左的文本进行顺时针的第二旋转角角度为

90
°
的第二旋转,或将其中朝右的文本进行逆时针的第二旋转角角度为+90
°
的第二旋转,获得文本在
±
45
°
范围内的投影;其中,与竖直正方向的夹角在[

90
°
,

45
°
)范围的文本标记为朝左,夹角为[

45
°
,45
°
]范围的文本标记为朝上,夹角为(45
°
,90
°
]的文本标记为朝右;
[0020]检测所述投影与竖直正方向的偏转角;
[0021]由所述第一旋转角、所述第二旋转角及所述偏转角的和得到所述倾斜角。
[0022]可以理解的是,上述上、下、左、右及正、负方向等为便于方案理解的叙述形式,并不限定文本的具体指向及坐标的必须设定,本领域的技术人员可在理解该方案的基础下,对其进行方案实质内容下的变形,如将向左、向右等定义为向水平正方向、向水平负方向等,将正、负进行统一调转等。
[0023]通过该进一步的方案,本专利技术可将图像的旋转角度检测问题转换为文字的朝向问题,将角度的检测范围从
±
180
°
减小到
±
45
°
,从而在避开了特殊角度(
±
180
°

±
90
°
等)检测的问题同时也大大减小了计算量,同时结合了投影检测在小范围的角度检测中的精准度高的特点,实现最终旋转角度的确定,可将检测精度从一般的
±1°
提升到
±
0.2
°

[0024]进一步的,所述检测方法中,所述前景灰度阈值和/或所述背景灰度阈值通过以下模型获得:
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本倾斜角度检测方法,其特征在于,其包括:对原始文本图像进行归一化预处理;所述归一化预处理包括:通过前景灰度阈值和背景灰度阈值对所述原始文本图像进行分区,其后进行分区归一化;其中,所述前景灰度阈值和/或所述背景灰度阈值通过局部阈值法获得的局部灰度阈值与灰度标准差综合得到。2.根据权利要求1所述的检测方法,其特征在于,其还包括:对经过所述归一化预处理后的文本图像进行增强处理。3.根据权利要求1所述的检测方法,其特征在于,其还包括:对经过所述归一化预处理后的文本图像,或经过所述归一化预处理并进一步进行增强处理后的文本图像进行目标提取及目标区域位置标注。4.根据权利要求3所述的检测方法,其特征在于,其还包括:对经过所述目标提取及目标区域位置标注后获得的目标图像进行倾斜角度检测;所述倾斜角度检测包括以下过程:在顺时针为负,逆时针为正的坐标系下:根据文本与竖直正方向的夹角,确定其是朝上还是朝下,并将其中确定为朝下的文本进行第一旋转角角度为+180
°


180
°
的第一旋转,使其转换为朝上;其中,与竖直正方向的夹角为(

90
°
,+90
°
)范围的文本标记为朝上,夹角为[

180
°


90
°
)或(+90
°
,+180
°
]范围的文本标记为朝下;在经过所述第一旋转后,进一步根据文本与竖直正方向的夹角,确定其是朝左、朝右还是朝上,并将其中朝左的文本进行顺时针的第二旋转角角度为

90
°
的第二旋转,或将其中朝右的文本进行逆时针的第二旋转角角度为+90
°
的第二旋转,获得文本在
±
45
°
范围内的投影;其中,与竖直正方向的夹角在[

90
°


45
°
)范围的文本标记为朝左,夹角为[

45
°
,45
°
]范围的文本标记为朝上,夹角为(45
°
,90
°
]的文本标记为朝右;检测所述投影与竖直正方向的偏转角;由所述第一旋转角、所述第二旋转角及所述偏转角的和得到所述倾斜角。5.根据权利要求1

4中任一项所述的检测方法,其特征在于,所述前景灰度阈值和/或所述背景灰度阈值通过以下模型获得:a(x,y)=T(x,y)

1....

【专利技术属性】
技术研发人员:孙健廖欣龚承志彭德光
申请(专利权)人:西南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1