一种文本行图像单字切分方法和装置制造方法及图纸

技术编号:18238224 阅读:33 留言:0更新日期:2018-06-17 01:41
本发明专利技术公开了一种文本行图像单字切分方法和装置,属于图像处理技术领域。包括对文本行图像进行预处理,并提取预处理后的文本行图像中的文本行;判断文本行中是否存在包含有粘连字符的连通域,若存在,则确认预设的执行模式,否则执行非粘连字符切分策略;在存在包含有粘连字符的连通域时,若预设的执行模式为第一执行模式,则利用形态学处理断开包含有粘连字符的连通域,并执行非粘连字符切分策略;若确认预设的执行模式为第二执行模式,则执行非粘连字符切分策略。本发明专利技术实施例能够针对文本行图像的粘连字符以及非粘连字符的不同场景,对单字切分方式加以区分,提高对文本行图像单字切分的准确性。 1

A single word segmentation method and device for text line image

The invention discloses a text line image monosyllabic segmentation method and device, belonging to the field of image processing technology. It includes the preprocessing of the text line image and the extraction of the text line in the preprocessed text line image; determines whether there is a connected domain containing the adhesive character in the text line. If it exists, the default execution mode is confirmed, otherwise the non adhesive character segmentation strategy is executed, and when there is a connected domain containing the conglutination character. If the presupposed execution mode is the first mode of execution, we use morphological processing to disconnect the connected domain containing the adhesive character and execute the non adhesive character segmentation strategy. If the default execution mode is confirmed as the second execution mode, the non adhesive character segmentation strategy is executed. The embodiment of the invention can distinguish the single word segmentation method against the different scenes of the adhesive character and non adhesive character of the text line image, so as to improve the accuracy of the single word segmentation of the text line image. One

【技术实现步骤摘要】
一种文本行图像单字切分方法和装置
本专利技术涉及图像处理
,特别涉及一种文本行图像单字切分方法和装置。
技术介绍
OCR(OpticalCharacterRecognition,字符识别)的流程一般是先做文本行图像检测,然后再对文本行图像进行单字切分,最后对每个切分出的单字进行识别。显然,文本行图像中的单字切分是字符识别中相当重要的环节,直接影响到最后的识别准确率。目前,对文本行图像进行单字切分,通常采用的单字切分方式是基于投影分割法,该方法利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隔将单个的字符图像切分出来。但是,专利技术人在本申请的研究过程中发现,在实际应用中,文本行图像的相邻字符间可能发生粘连,也可能不粘连,此时采用基于投影分割法对文本行图像进行单字切分,就会将发生粘连的字符误切分为一个字符,出现分割错误,同时,也会将某个字符的中文部首误切分为一个独立字符,进而导致字符切分的准确性较低,因此针对文本行图像的粘连字符以及非粘连字符的不同场景,需要对单字切分方式加以区分,以提高对文本行图像单字切分的准确性。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种文本行图像单字切分方法和装置,以针对文本行图像的粘连字符以及非粘连字符的不同场景,对单字切分方式加以区分,实现提高对文本行图像单字切分的准确性的目的。所述技术方案如下:第一方面,提供了一种文本行图像单字切分方法,所述方法包括:步骤S1:对文本行图像进行预处理,并提取预处理后的所述文本行图像中的文本行;步骤S2:判断所述文本行中是否存在包含有粘连字符的连通域,若存在,则执行步骤S3,否则执行步骤S5;步骤S3:确认预设的执行模式是为第一执行模式还是为第二执行模式,若为所述第一执行模式,则执行步骤S4,若为所述第二执行模式,则执行步骤S6;步骤S4:利用形态学处理断开所述包含有粘连字符的连通域,执行步骤S5;步骤S5:执行非粘连字符切分策略,对所述文本行进行单字切分;步骤S6:执行粘连字符切分策略,对所述文本行进行单字切分。结合第一方面,在第一种可能的实现方式中,所述步骤S1中对文本行图像进行预处理包括:步骤S11:获取所述文本行图像的灰度图;步骤S12:采用预设聚类算法对所述文本行图像的灰度图进行聚类分割;步骤S13:根据聚类分割结果,确定所述文本行图像的背景和作为前景的所述文本行;步骤S14:调整作为前景的所述文本行的像素亮度值高于背景的像素亮度值。结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述步骤S1中对文本行图像进行预处理进一步还包括:步骤S15:若所述文本行与所述背景的像素平均值差值小于预设差值阈值,则对所述文本行图像的灰度图进行灰度拉伸处理。结合第一方面,在第三种可能的实现方式中,所述步骤S2中判断所述文本行中是否存在包含有粘连字符的连通域包括:步骤S21:确定所述文本行的各个连通域的宽度值;步骤S22:检测是否存在宽度突变的连通域,若存在,则判定存在宽度突变的连通域为所述包含有粘连字符的连通域。结合第一方面,在第四种可能的实现方式中,所述步骤S5包括:步骤S51:在所述文本行的所有连通域中,将满足连通域合并规则的连通域合并成合并区域;以及步骤S52:基于合并后得到的各个合并区域及未合并的各个连通域,对所述文本行进行单字切分。结合第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述步骤S51包括:步骤S511:在垂直方向上合并具有上下位置关系的至少两个连通域;步骤S512:在水平方向上合并具有重叠关系的至少两个连通域;步骤S513:合并间距小于所述所有连通域中两两相邻连通域的平均间距的两个相邻连通域;其中,所述合并区域的宽度不超过由所述所有连通域的平均宽度确定的宽度阈值。结合第一方面,在第六种可能的实现方式中,所述步骤S6包括:步骤S61:确定所述文本行的平均字符宽度;步骤S62:根据所述平均字符宽度和所述文本行的垂直投影直方图,获取所述垂直投影直方图上的多个目标切分点;步骤S63:根据所述多个目标切分点,对所述文本行进行单字切分。结合第一方面的第六种可能的实现方式,在第七种可能的实现方式中,所述步骤S62包括:步骤S621:根据所述平均字符宽度和所述文本行的垂直投影直方图,确定所述文本行的当前切分位置,所述当前切分位置与上一个字符左边界之间的距离设定为所述平均字符宽度;步骤S622:在所述当前切分位置所在区域内,获取三个候选切分点;以及步骤S623:在所述三个候选切分点中,将像素值最小且像素值低于所述垂直投影直方图上像素平均值的切分点确定为当前目标切分点;步骤S624:确定所述当前目标切分点的下一个像素点为下一个字符左边界;重复步骤S622至步骤S624,直至获取到所有的目标切分点。第二方面,提供了一种文本行图像单字切分装置,所述装置包括:预处理模块,用于对文本行图像进行预处理;提取模块,与所述预处理模块连接,用于提取预处理后的所述文本行图像中的文本行;判断模块,与所述提取模块连接,用于判断所述文本行中是否存在包含有粘连字符的连通域;确认模块,与所述判断模块连接,用于若存在包含有粘连字符的连通域时,确认预设的执行模式是为第一执行模式还是为第二执行模式;断开模块,与所述确认模块连接,用于若为所述第一执行模式时,利用形态学处理断开所述包含有粘连字符的连通域;非粘连字符切分模块,与所述判断模块及所述断开模块连接,用于执行非粘连字符切分策略,对所述文本行进行单字切分;粘连字符切分模块,与所述确认模块连接,用于若为所述第二执行模式时,执行粘连字符切分策略,对所述文本行进行单字切分。结合第二方面,在第一种可能的实现方式中,所述预处理模块具体包括:第一获取子模块,用于获取所述文本行图像的灰度图;聚类分割子模块,用于采用预设聚类算法对所述文本行图像的灰度图进行聚类分割;第一确定子模块,用于根据聚类分割结果,确定所述文本行图像的背景和作为前景的所述文本行;调整子模块,用于调整作为前景的所述文本行的像素亮度值高于背景的像素亮度值。结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述预处理模块进一步还包括:灰度拉伸处理子模块,用于若所述文本行与所述背景的像素平均值差值小于预设差值阈值,则对所述文本行图像的灰度图进行灰度拉伸处理。结合第二方面,在第三种可能的实现方式中,所述判断模块包括:第二确定子模块,用于确定所述文本行的各个连通域的宽度值;检测子模块,用于检测是否存在宽度突变的连通域,若存在,则判定存在宽度突变的连通域为所述包含有粘连字符的连通域。结合第二方面,在第四种可能的实现方式中,所述非粘连字符切分模块包括:合并子模块,用于在所述文本行的所有连通域中,将满足连通域合并规则的连通域合并成合并区域;非粘连字符切分子模块,用于基于合并后得到的各个合并区域及未合并的各个连通域,对所述文本行进行单字切分。结合第二方面的第四种可能的实现方式,在第五种可能的实现方式中,所述合并子模块包括:第一合并单元,用于在垂直方向上合并具有上下位置关系的至少两个连通域;第二合并单元,用于在水平方向上合并具有重叠关系的至少两个连通域;第三合并单元,用于合并间距小于所述所有连通域中两两相邻连通域的平均间距的两个本文档来自技高网...
一种文本行图像单字切分方法和装置

【技术保护点】
1.一种文本行图像单字切分方法,其特征在于,所述方法包括:

【技术特征摘要】
1.一种文本行图像单字切分方法,其特征在于,所述方法包括:步骤S1:对文本行图像进行预处理,并提取预处理后的所述文本行图像中的文本行;步骤S2:判断所述文本行中是否存在包含有粘连字符的连通域,若存在,则执行步骤S3,否则执行步骤S5;步骤S3:确认预设的执行模式是为第一执行模式还是为第二执行模式,若为所述第一执行模式,则执行步骤S4,若为所述第二执行模式,则执行步骤S6;步骤S4:利用形态学处理断开所述包含有粘连字符的连通域,执行步骤S5;步骤S5:执行非粘连字符切分策略,对所述文本行进行单字切分;步骤S6:执行粘连字符切分策略,对所述文本行进行单字切分。2.根据权利要求1所述的方法,其特征在于,所述步骤S1中对文本行图像进行预处理包括:步骤S11:获取所述文本行图像的灰度图;步骤S12:采用预设聚类算法对所述文本行图像的灰度图进行聚类分割;步骤S13:根据聚类分割结果,确定所述文本行图像的背景和作为前景的所述文本行;步骤S14:调整作为前景的所述文本行的像素亮度值高于背景的像素亮度值。3.根据权利要求2所述的方法,其特征在于,所述步骤S1中对文本行图像进行预处理进一步还包括:步骤S15:若所述文本行与所述背景的像素平均值差值小于预设差值阈值,则对所述文本行图像的灰度图进行灰度拉伸处理。4.根据权利要求1所述的方法,其特征在于,所述步骤S2中判断所述文本行中是否存在包含有粘连字符的连通域包括:步骤S21:确定所述文本行的各个连通域的宽度值;步骤S22:检测是否存在宽度突变的连通域,若存在,则判定存在宽度突变的连通域为所述包含有粘连字符的连通域。5.根据权利要求1所述的方法,其特征在于,所述步骤S5包括:步骤S51:在所述文本行的所有连通域中,将满足连通域合并规则的连通域合并成合并区域;以及步骤S52:基于合并后得到的各个合并区域及未合并的各个连通域,对所述文本行进行单字切分。6.根据权利要求5所述的方法,其特征在于,所述步骤S51包括:步骤S511:在垂直方向上合并具有上下位置关系的至少两个连通域;步骤S512:在水平方向上合并具有重叠关系的至少两个连通域;步骤S513:合并间距小于所述所有连通域中两两相邻连通域的平均间距的两个相邻连通域;其中,所述合并区域的宽度不超过由所述所有连通域的平均宽度确定的宽度阈值。7.根据权利要求1所述的方法,其特征在于,所述步骤S6包括:步骤S61:确定所述文本行的平均字符宽度;步骤S62:根据所述平均字符宽度和所述文本行的垂直投影直方图,获取所述垂直投影直方图上的多个目标切分点;其中,所述多个目标切分点中的两两相邻切分点的间距不超过由所述平均字符宽度确定的宽度阈值;步骤S63:根据所述多个目标切分点,对所述文本行进行单字切分。8.根据权利要求7所述的方法,其特征在于,所述步骤S62包括:步骤S621:根据所述平均字符宽度和所述文本行的垂直投影直方图,确定所述文本行的当前切分位置,所述当前切分位置与上一个字符左边界之间的距离设定为所述平均字符宽度;步骤S622:在所述当前切分位置所在区域内,获取三个候选切分点;步骤S623:在所述三个候选切分点中,将像素值最小且像素值低于所述垂直投影直方图上像素平均值的切分点确定为当前目标切分点;步骤S624:确定所述当前目标切分点的下一个像素点为下一个字符左边界;重复步骤S622至步骤S624,直至获取到所有的目标切分点。9.一种文本行图像单字切分装置,其特征在于,所述装置包括:预处理模块,用于对文本行图...

【专利技术属性】
技术研发人员:邱君华李宏宇
申请(专利权)人:众安信息技术服务有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1