The invention discloses a text line image monosyllabic segmentation method and device, belonging to the field of image processing technology. It includes the preprocessing of the text line image and the extraction of the text line in the preprocessed text line image; determines whether there is a connected domain containing the adhesive character in the text line. If it exists, the default execution mode is confirmed, otherwise the non adhesive character segmentation strategy is executed, and when there is a connected domain containing the conglutination character. If the presupposed execution mode is the first mode of execution, we use morphological processing to disconnect the connected domain containing the adhesive character and execute the non adhesive character segmentation strategy. If the default execution mode is confirmed as the second execution mode, the non adhesive character segmentation strategy is executed. The embodiment of the invention can distinguish the single word segmentation method against the different scenes of the adhesive character and non adhesive character of the text line image, so as to improve the accuracy of the single word segmentation of the text line image. One
【技术实现步骤摘要】
一种文本行图像单字切分方法和装置
本专利技术涉及图像处理
,特别涉及一种文本行图像单字切分方法和装置。
技术介绍
OCR(OpticalCharacterRecognition,字符识别)的流程一般是先做文本行图像检测,然后再对文本行图像进行单字切分,最后对每个切分出的单字进行识别。显然,文本行图像中的单字切分是字符识别中相当重要的环节,直接影响到最后的识别准确率。目前,对文本行图像进行单字切分,通常采用的单字切分方式是基于投影分割法,该方法利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隔将单个的字符图像切分出来。但是,专利技术人在本申请的研究过程中发现,在实际应用中,文本行图像的相邻字符间可能发生粘连,也可能不粘连,此时采用基于投影分割法对文本行图像进行单字切分,就会将发生粘连的字符误切分为一个字符,出现分割错误,同时,也会将某个字符的中文部首误切分为一个独立字符,进而导致字符切分的准确性较低,因此针对文本行图像的粘连字符以及非粘连字符的不同场景,需要对单字切分方式加以区分,以提高对文本行图像单字切分的准确性。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种文本行图像单字切分方法和装置,以针对文本行图像的粘连字符以及非粘连字符的不同场景,对单字切分方式加以区分,实现提高对文本行图像单字切分的准确性的目的。所述技术方案如下:第一方面,提供了一种文本行图像单字切分方法,所述方法包括:步骤S1:对文本行图像进行预处理,并提取预处理后的所述文本行图像中的文本行;步骤S2:判断所述文本行中是否存在包含有粘连字符的连通域,若存在,则执行步 ...
【技术保护点】
1.一种文本行图像单字切分方法,其特征在于,所述方法包括:
【技术特征摘要】
1.一种文本行图像单字切分方法,其特征在于,所述方法包括:步骤S1:对文本行图像进行预处理,并提取预处理后的所述文本行图像中的文本行;步骤S2:判断所述文本行中是否存在包含有粘连字符的连通域,若存在,则执行步骤S3,否则执行步骤S5;步骤S3:确认预设的执行模式是为第一执行模式还是为第二执行模式,若为所述第一执行模式,则执行步骤S4,若为所述第二执行模式,则执行步骤S6;步骤S4:利用形态学处理断开所述包含有粘连字符的连通域,执行步骤S5;步骤S5:执行非粘连字符切分策略,对所述文本行进行单字切分;步骤S6:执行粘连字符切分策略,对所述文本行进行单字切分。2.根据权利要求1所述的方法,其特征在于,所述步骤S1中对文本行图像进行预处理包括:步骤S11:获取所述文本行图像的灰度图;步骤S12:采用预设聚类算法对所述文本行图像的灰度图进行聚类分割;步骤S13:根据聚类分割结果,确定所述文本行图像的背景和作为前景的所述文本行;步骤S14:调整作为前景的所述文本行的像素亮度值高于背景的像素亮度值。3.根据权利要求2所述的方法,其特征在于,所述步骤S1中对文本行图像进行预处理进一步还包括:步骤S15:若所述文本行与所述背景的像素平均值差值小于预设差值阈值,则对所述文本行图像的灰度图进行灰度拉伸处理。4.根据权利要求1所述的方法,其特征在于,所述步骤S2中判断所述文本行中是否存在包含有粘连字符的连通域包括:步骤S21:确定所述文本行的各个连通域的宽度值;步骤S22:检测是否存在宽度突变的连通域,若存在,则判定存在宽度突变的连通域为所述包含有粘连字符的连通域。5.根据权利要求1所述的方法,其特征在于,所述步骤S5包括:步骤S51:在所述文本行的所有连通域中,将满足连通域合并规则的连通域合并成合并区域;以及步骤S52:基于合并后得到的各个合并区域及未合并的各个连通域,对所述文本行进行单字切分。6.根据权利要求5所述的方法,其特征在于,所述步骤S51包括:步骤S511:在垂直方向上合并具有上下位置关系的至少两个连通域;步骤S512:在水平方向上合并具有重叠关系的至少两个连通域;步骤S513:合并间距小于所述所有连通域中两两相邻连通域的平均间距的两个相邻连通域;其中,所述合并区域的宽度不超过由所述所有连通域的平均宽度确定的宽度阈值。7.根据权利要求1所述的方法,其特征在于,所述步骤S6包括:步骤S61:确定所述文本行的平均字符宽度;步骤S62:根据所述平均字符宽度和所述文本行的垂直投影直方图,获取所述垂直投影直方图上的多个目标切分点;其中,所述多个目标切分点中的两两相邻切分点的间距不超过由所述平均字符宽度确定的宽度阈值;步骤S63:根据所述多个目标切分点,对所述文本行进行单字切分。8.根据权利要求7所述的方法,其特征在于,所述步骤S62包括:步骤S621:根据所述平均字符宽度和所述文本行的垂直投影直方图,确定所述文本行的当前切分位置,所述当前切分位置与上一个字符左边界之间的距离设定为所述平均字符宽度;步骤S622:在所述当前切分位置所在区域内,获取三个候选切分点;步骤S623:在所述三个候选切分点中,将像素值最小且像素值低于所述垂直投影直方图上像素平均值的切分点确定为当前目标切分点;步骤S624:确定所述当前目标切分点的下一个像素点为下一个字符左边界;重复步骤S622至步骤S624,直至获取到所有的目标切分点。9.一种文本行图像单字切分装置,其特征在于,所述装置包括:预处理模块,用于对文本行图...
【专利技术属性】
技术研发人员:邱君华,李宏宇,
申请(专利权)人:众安信息技术服务有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。