一种基于信号处理的文本图像行分割方法及其系统技术方案

技术编号：19964980 阅读：23 留言：0更新日期：2019-01-03 13:12

本发明专利技术涉及一种基于信号处理的文本图像行分割方法及其系统，其中该方法包括：文本图像切割成多个子文本图像；对每个子文本图像，得到每一像素行的行像素求和值，组成该子文本图像的行像素求和序列；对每个子文本图像的行像素求和序列进行低通滤波和带通滤波；计算每个子文本图像的行像素求和序列的局部极大值并过滤；依次连接过滤后的沿文本图像中文本行书写方向的相邻子文本图像的局部极大值所对应的像素点，得到整幅文本图像的文本行方向线；计算相邻两个文本行方向线之间的文本图像梯度，确定相邻两个文本行之间的分割线。本发明专利技术实施例提出的基于信号处理的文本图像行分割方法及其系统可以减少噪声对局部极大值的影响，提高分割的准确性。

A Method and System of Text Image Line Segmentation Based on Signal Processing

The present invention relates to a method and system of text image line segmentation based on signal processing, which includes: text image is cut into multiple sub-text images; line pixel summation values of each pixel row are obtained for each sub-text image to form the line pixel summation sequence of the sub-text image; low pass filtering and banding are carried out for the line pixel summation sequence of each sub-text image. Pass filtering; calculating the local maximum of the sum sequence of line pixels of each sub-text image and filtering; connecting the pixels corresponding to the local maximum of the filtered adjacent sub-text image along the direction of text line writing in the text image sequentially to get the text line direction of the whole text image; calculating the gradient of text image between the two adjacent line directions to determine the adjacent line. A line of partition between two lines of text. The method and system of text image line segmentation based on signal processing proposed in the embodiment of the present invention can reduce the influence of noise on local maximum and improve the accuracy of segmentation.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于信号处理的文本图像行分割方法及其系统
本专利技术属于图像处理
，具体涉及一种基于信号处理的文本图像行分割方法及其系统。
技术介绍
文本图像是指包含文本的图像，将文本图像分割成文本行，是词检索、关键词搜索、文本对齐等文本图像分析项目的基本任务。文本图像中包含的文本可以是机器印刷文本，也可以是书写者在书写表面自然手写而成的文本。行分割算法是文本图像分析中经常使用的技术。行分割算法是从一张文本图像中分割出多个子图像，每个子图像仅包含一行文本。在进行文本图像分析时，经过行分割算法得到的包含单行文本的子图像，相比文本图像来说，更易于处理，并且容易获得更理想的分析结果，例如，减少文本以外的噪声影响，获得更高的文本识别率。机器印刷文本一般字体较工整，文本行的间隔较明显，但自然手写文本的字体和文本行间隔，会因为书写者的书写习惯，而难以识别，例如，同一文本中，不同文本行甚至同一文本行可能会有不同的倾斜角度，或者相邻的文本行之间部分或全部行间隔不明显或不存在。目前使用的基于投影的行分割方法，对印刷文本有较好的分析效果，但对于存在行弯曲的手写文本图像的分析效果却不理想。基于随机模型的行分割算法能够较好地适应不同的书写习惯，但计算复杂度高。
技术实现思路
为了解决上述对手写文本图像分析效果不佳或者计算复杂度高的技术问题，本专利技术实施例提出了一种基于信号处理的文本图像行分割方法及其系统。一种基于信号处理的文本图像行分割方法，该方法包括：步骤S101：对文本图像沿与文本图像中文本行书写方向相垂直的方向进行切割，分成多个子文本图像；步骤S102：针对每个子文本图像，对该子文...

【技术保护点】
1.一种基于信号处理的文本图像行分割方法，其特征在于，该方法包括：步骤S101：对文本图像沿与文本图像中文本行书写方向相垂直的方向进行切割，分成多个子文本图像；步骤S102：针对每个子文本图像，对该子文本图像的每一像素行的像素值进行求和，得到每一像素行的行像素求和值，该子文本图像的所有像素行的行像素求和值组成该子文本图像的行像素求和序列；步骤S103：对每个子文本图像的行像素求和序列进行低通滤波；步骤S104：对低通滤波后的每个子文本图像的行像素求和序列进行带通滤波；步骤S105：计算带通滤波后的每个子文本图像的行像素求和序列的局部极大值，得到每个子文本图像的行像素求和序列的局部极大值集合；步骤S106：对每个子文本图像的行像素求和序列的局部极大值集合中的局部极大值进行过滤，去除由噪声引起的行像素求和序列的局部极大值；步骤S107：按照距离最近的原则，从文本图像中文本行书写方向的第一个子文本图像开始，依次连接过滤后的沿文本图像中文本行书写方向的相邻子文本图像的局部极大值所对应的像素点，得到整幅文本图像的文本行方向线；步骤S108：计算相邻两个文本行方向线之间的文本图像梯度，根据梯度最小...

【技术特征摘要】
1.一种基于信号处理的文本图像行分割方法，其特征在于，该方法包括：步骤S101：对文本图像沿与文本图像中文本行书写方向相垂直的方向进行切割，分成多个子文本图像；步骤S102：针对每个子文本图像，对该子文本图像的每一像素行的像素值进行求和，得到每一像素行的行像素求和值，该子文本图像的所有像素行的行像素求和值组成该子文本图像的行像素求和序列；步骤S103：对每个子文本图像的行像素求和序列进行低通滤波；步骤S104：对低通滤波后的每个子文本图像的行像素求和序列进行带通滤波；步骤S105：计算带通滤波后的每个子文本图像的行像素求和序列的局部极大值，得到每个子文本图像的行像素求和序列的局部极大值集合；步骤S106：对每个子文本图像的行像素求和序列的局部极大值集合中的局部极大值进行过滤，去除由噪声引起的行像素求和序列的局部极大值；步骤S107：按照距离最近的原则，从文本图像中文本行书写方向的第一个子文本图像开始，依次连接过滤后的沿文本图像中文本行书写方向的相邻子文本图像的局部极大值所对应的像素点，得到整幅文本图像的文本行方向线；步骤S108：计算相邻两个文本行方向线之间的文本图像梯度，根据梯度最小值，确定相邻两个文本行之间的分割线。2.根据权利要求1所述的方法，其特征在于，所述步骤S106中的所述对每个子文本图像的行像素求和序列的局部极大值集合进行过滤的方法，包括以下步骤：首先，计算每个局部极大值左边距离最近的局部极小值和右边距离最近的局部极小值；其次，计算左边距离最近的局部极小值与该局部极大值的差值，以及计算右边距离最近的局部极小值与该局部极大值的差值，当这两个差值的绝对值均小于预设值时，将该局部极大值滤除。3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：步骤S109：根据步骤S108确定的分割线，分割出每个文本行的子图像，统计分割出的所有文本行的子图像的行高的中值，将每个文本行的子图像的行高与统计的中值进行比较，如果某一个文本行的子图像的行高远大于或远小于统计的中值，则将该文本行剔除。4.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：步骤S110：根据步骤S108确定的分割线，分割出每个文本行的子图像，对每个文本行的子图像的每一行像素进行求和，得到一个求和序列，统计该求和序列中大于设定阈值的元素的数目，如果该数目小于该设定阈值，则将该文本行剔除。5.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：步骤S109：根据步骤S108确定的分割线，分割出每个文本行的子图像，统计分割出的所有文本行的子图像的行高的中值，将每个文本行的子图像的行高与统计的中值进行比较，如果某一个文本行的子图像的行高远大于或远小于统计的中值，则将该文本行剔除；步骤S110：对剩余的每个文本行的子图像的每一行像素进行求和，得到一个求和序列，统计该求和序列中大于设定阈值的元素的数目，如果该数目小于该设定阈值，则将该文本行剔除。6.一种基于信号处理的文本图像行分割系统，其特征在于，该系统包括依次连接的切割模块、第一求和模块、低通滤波模块、带通滤波模块、计...

【专利技术属性】
技术研发人员：李德健，
申请(专利权)人：广州视源电子科技股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人