【技术实现步骤摘要】
一种文本倾斜角度检测方法、系统及存储介质
[0001]本专利技术涉及计算机视觉图像处理
,尤其涉及基于深度学习的计算机视觉图像处理技术。
技术介绍
[0002]文本倾斜角度的检测在文本识别的预处理步骤中起着至关重要的作用。研究表明,将没有文本倾斜角度检测的文本识别系统直接应用于带有倾斜角度的文档的识别中时,系统的识别率将大大降低,因此,快速而准确的文本倾斜角度的检测是有必要的。
[0003]最常用的文本倾斜角度的检测方法是基于投影的文本倾斜检测,它通过不断的旋转图像,并分析旋转后的图像的投影来确定图像的倾斜角度,这种方法计算量巨大且对于偏转了特殊角度(例如
±
90
°
,
±
180
°
)的图像不能进行准确检测,获得准确的偏转角度;另一种常见的检测方法为基于霍夫变换的文档倾斜角度检测,该方法通过检测文档的直线,并且将直线的坐标从笛卡尔坐标系转换为极坐标系的方式很好的实现了90
°
倾斜角度的检测,但是这种方法对于图像的质量要求较高,如果是简单的纯文本的扫描图像能够很好的工作,对于自然场景下的带有噪声的文档该算法的性能就会急剧下降。
[0004]近些年来,机器学习尤其是深度学习的快速发展,给了文档倾斜角度的检测一种新思路,如现有技术中提出了通过一个360分类的卷积神经网络来将角度检测问题转换为一个分类问题的手段,但是,这种方法需要巨量的且必须是精心设计的原始样本才能使分类器有一个很好分类的效果,而且,该分类器的检测 ...
【技术保护点】
【技术特征摘要】
1.一种文本倾斜角度检测方法,其特征在于,其包括:对原始文本图像进行归一化预处理;所述归一化预处理包括:通过前景灰度阈值和背景灰度阈值对所述原始文本图像进行分区,其后进行分区归一化;其中,所述前景灰度阈值和/或所述背景灰度阈值通过局部阈值法获得的局部灰度阈值与灰度标准差综合得到。2.根据权利要求1所述的检测方法,其特征在于,其还包括:对经过所述归一化预处理后的文本图像进行增强处理。3.根据权利要求1所述的检测方法,其特征在于,其还包括:对经过所述归一化预处理后的文本图像,或经过所述归一化预处理并进一步进行增强处理后的文本图像进行目标提取及目标区域位置标注。4.根据权利要求3所述的检测方法,其特征在于,其还包括:对经过所述目标提取及目标区域位置标注后获得的目标图像进行倾斜角度检测;所述倾斜角度检测包括以下过程:在顺时针为负,逆时针为正的坐标系下:根据文本与竖直正方向的夹角,确定其是朝上还是朝下,并将其中确定为朝下的文本进行第一旋转角角度为+180
°
或
‑
180
°
的第一旋转,使其转换为朝上;其中,与竖直正方向的夹角为(
‑
90
°
,+90
°
)范围的文本标记为朝上,夹角为[
‑
180
°
,
‑
90
°
)或(+90
°
,+180
°
]范围的文本标记为朝下;在经过所述第一旋转后,进一步根据文本与竖直正方向的夹角,确定其是朝左、朝右还是朝上,并将其中朝左的文本进行顺时针的第二旋转角角度为
‑
90
°
的第二旋转,或将其中朝右的文本进行逆时针的第二旋转角角度为+90
°
的第二旋转,获得文本在
±
45
°
范围内的投影;其中,与竖直正方向的夹角在[
‑
90
°
,
‑
45
°
)范围的文本标记为朝左,夹角为[
‑
45
°
,45
°
]范围的文本标记为朝上,夹角为(45
°
,90
°
]的文本标记为朝右;检测所述投影与竖直正方向的偏转角;由所述第一旋转角、所述第二旋转角及所述偏转角的和得到所述倾斜角。5.根据权利要求1
‑
4中任一项所述的检测方法,其特征在于,所述前景灰度阈值和/或所述背景灰度阈值通过以下模型获得:a(x,y)=T(x,y)
‑
1....
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。