一种基于SWT的多方向中文印刷体文字检测方法技术

技术编号:20486404 阅读:33 留言:0更新日期:2019-03-02 19:35
本发明专利技术提供了一种基于SWT的多方向中文印刷体文字检测方法,其首先通过二维离散傅里叶变换校正倾斜图像,然后通过水平投影直方图,快速提取首行文本区域,对于存在倾斜角度大的图像,提取文本前三行作为识别区域,避免了对整个文本的检测,提高了检测速度;同时本发明专利技术对提取完的文本行进行Canny边缘检测,最后基于改进的SWT算法,结合相关文本检测、过滤的启发式规则,检测图像是否是中文印刷体图像。由此可见,本发明专利技术通过基于改进的SWT算法,提取中文文本固有的笔画宽度特征,同时结合二维离散傅里叶变化以及设定的文本启发式规则,可以快速、准确的检测图像是否是中文印刷体图像,提高了OCR预处理阶段的文本识别检测效率。

【技术实现步骤摘要】
一种基于SWT的多方向中文印刷体文字检测方法
本专利技术属于数字图像处理
,具体涉及一种基于SWT的多方向中文印刷体文字检测方法。
技术介绍
现阶段在纸质资料数字化,文本化的大背景下,传统的纸质资料由于占空间、不便保存、查找繁琐、易丢失等缺点正被数字化的资料所取代,然而传统的数字化大量采用的是扫描方式,以图像的形式进行各种资料的存档保存。在实际应用中如何快速从大量的数字化图像文件中找出中文印刷体文本图像文件进行OCR(OpticalCharacterRecognition)识别是一个现实存在的实际需求。图像文本的检测技术目前主要有以下五种:基于边缘的方法、基于连通域的方法、基于纹理的方法、基于深度学习的方法、基于上述混合的方法;其中由BorisEpshtein等人在标题为Detectingtextinnaturalsceneswithstrokewidthtransform(ComputerVisionandPatternRecognition(CVPR),2010IEEEConferenceon.IEEE,2010:2963~2970)一文中提出的笔画宽度变换算法(Strok本文档来自技高网...

【技术保护点】
1.一种基于SWT的多方向中文印刷体文字检测方法,包括如下步骤:(1)对待检测的图像依次进行灰度化以及缩放的预处理操作,(2)对预处理后的图像进行倾斜校正;(3)从经校正后的图像中提取文本行作为ROI;(4)对ROI进行canny边缘检测处理,提取文本行的文字边缘检测图;(5)采用SWT算法对文字边缘检测图进行文本检测,得到包含文字笔画宽度信息的SWT图像;(6)基于改进的SWT文本启发式规则对SWT图像中不符合中文文字特征的区域进行过滤,过滤后剩余保留下来的区域即为字符连通域;(7)对满足相关聚类条件的字符连通域聚类成行,形成文本行连通域;(8)基于启发式规则对文本行连通域进行检测,从而识别...

【技术特征摘要】
1.一种基于SWT的多方向中文印刷体文字检测方法,包括如下步骤:(1)对待检测的图像依次进行灰度化以及缩放的预处理操作,(2)对预处理后的图像进行倾斜校正;(3)从经校正后的图像中提取文本行作为ROI;(4)对ROI进行canny边缘检测处理,提取文本行的文字边缘检测图;(5)采用SWT算法对文字边缘检测图进行文本检测,得到包含文字笔画宽度信息的SWT图像;(6)基于改进的SWT文本启发式规则对SWT图像中不符合中文文字特征的区域进行过滤,过滤后剩余保留下来的区域即为字符连通域;(7)对满足相关聚类条件的字符连通域聚类成行,形成文本行连通域;(8)基于启发式规则对文本行连通域进行检测,从而识别待检测的图像是否为中文印刷体图像。2.根据权利要求1所述的多方向中文印刷体文字检测方法,其特征在于:所述步骤(1)中对待检测的图像进行缩放,使其缩放至650×850大小。3.根据权利要求1所述的多方向中文印刷体文字检测方法,其特征在于:所述步骤(2)的具体实现过程为:首先,对图像进行二维离散傅里叶变换,得到图像对应的频率分布图;然后,对该频率分布图中左上、右上、左下、右下四个角频率分布块进行象限交换及平移操作,将图像频谱从原点移动到图像中心点,使得四个角频率分布块均集中在频率分布图的中心;最后,对频率分布图进行二值化,通过霍夫线检测技术画出分布图中的倾斜角度线,进而根据该倾斜角度线对原图像进行倾斜校正。4.根据权利要求1...

【专利技术属性】
技术研发人员:张华熊周一枫胡洁林翔宇何利力王玉平
申请(专利权)人:浙江理工大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1