文档图像处理方法、文档图像处理装置及存储介质制造方法及图纸

技术编号:22295958 阅读:39 留言:0更新日期:2019-10-15 05:02
本发明专利技术提供一种文档图像处理方法、文档图像处理装置及存储介质。所述文档图像中包括与线接触的文本行,所述文档图像处理方法包括:将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;根据子区域中包含的字符和与字符接触的线的方向来确定该子区域的文本方向;利用确定出的子区域的文本方向来确定待处理文本行中与文本行接触的线。

Document Image Processing Method, Document Image Processing Device and Storage Media

【技术实现步骤摘要】
文档图像处理方法、文档图像处理装置及存储介质
本专利技术涉及一种文档图像处理技术,尤其涉及一种将文档图像中的文本行和与之相接触的线分离的技术。
技术介绍
针对电子文档的处理获得了日益广泛的关注并在多个领域广泛应用,在电子文档处理技术中,诸如OCR(光学字符识别)等的文档图像识别技术在不同类型的设备中得到了大量的应用。例如,在包括扫描仪的MFP(多功能外围设备)中应用文档图像识别技术,或是在照相机、智能手机等设备中应用文档图像识别技术。通常,将印刷有文字的书本、纸张等通过扫描仪的扫描或照相机的拍摄后生成的电子文档称为文档图像(DocumentImage),在文档图像中,可能存在文本行与线相接触(像素点的重叠、叠加)的情况。图1(a)示出了文档图像中的文本行和下划线相接触的示意图。除了图1(a)所示的下划线以外,还可能存在文本行与表格线、删除线等其他线相接触的情况。为了将文档图像中的文本行和与之相接触的线分离开,提出了一种从文档图像中去除与文本行相接触的线的技术。首先,对图1(a)所示的文档图像进行诸如倾斜校正、去噪等预处理,得到图1(b)所示的预处理后的文档图像。接着,利用霍夫变换等方式检测出图1(b)中的水平线,即要被去除的下划线。最后,基于检测出的水平线的宽度(图1(b)中所示的水平线在Y轴方向上的像素点的数量),去除检测出的水平线,同时利用形态学的闭合操作,将去除水平线时可能断开的文本行中的各字符的笔画连接起来,得到图1(c)中所示的去除了下划线但保持了字符笔画的结果。图1(a)所示的文档图像中的内容虽然存在诸如倾斜等线性变形,但通过倾斜校正等预处理手段可对线性变形进行校正,使得校正后的字符和线都处于水平或垂直方向,因而可通过去除直线状态的下划线来达到去除线的目的。但是,在利用扫描仪或照相机获得文档图像时,被扫描或被拍摄的书本/纸张可能是有一定厚度且不平的,因此,得到的文档图像中的内容可能存在图2所示的非线性变形。在此情况下,如果仍使用上述针对线性变形的线去除方式来去除非线性变形的线的话,是无法得到较好的线去除结果的。
技术实现思路
本专利技术旨在提供一种能够针对非线性变形的文档图像,去除其中与文本行相接触的线的方案,以实现在非线性状态下去除与文本行接触的线的目的。根据本专利技术的一个方面,提供了一种文档图像处理方法,所述文档图像中包括与线接触的文本行,所述文档图像处理方法包括:将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;根据子区域中包含的字符和与字符接触的线的方向来确定该子区域的文本方向;利用确定出的子区域的文本方向来确定待处理文本行中与文本行接触的线。根据本专利技术的另一个方面,提供了一种文档图像处理装置,该装置所处理的文档图像中包括与线接触的文本行,所述文档图像处理装置包括:子区域划分单元,其被构造为:将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;文本方向确定单元,其被构造为:根据子区域中包含的字符和与字符接触的线的方向来确定该子区域的文本方向;线确定单元,其被构造为:利用确定出的子区域的文本方向来确定待处理文本行中与文本行接触的线。根据本专利技术的另一个方面,提供了一种存储指令的非暂时性计算机可读存储介质,所述指令在由计算机执行时使所述计算机进行文档图像处理方法,所述文档图像中包括与线接触的文本行,所述方法包括:将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;根据子区域中包含的字符和与字符接触的线的方向来确定该子区域的文本方向;利用确定出的子区域的文本方向来确定待处理文本行中与文本行接触的线。从以下参照附图对示例性实施例的描述,本专利技术的其它特征将变得清楚。附图说明并入说明书中并且构成说明书的一部分的附图示出了本专利技术的实施例,并且与实施例的描述一起用于解释本专利技术的原理。图1(a)例示了文档图像中的文本行和下划线相接触的示意图。图1(b)例示了预处理后的文档图像的示意图。图1(c)例示了去除下划线后的文档图像的示意图。图2例示了非线性变形的文档图像的示意图。图3例示了包括多个文本行的文档图像的示意图。图4例示了本专利技术第一实施例的文档图像处理方法步骤流程图。图5例示了待处理文本行的示意图。图6(a)例示了基于顶/底轮廓的子区域划分方法的步骤流程图。图6(b)例示了在基于顶/底轮廓的子区域划分处理中的、X-Y坐标轴中的待处理文本行的示意图。图6(c)例示了在基于顶/底轮廓的子区域划分处理中的划分出子区域的待处理文本行的示意图。图7(a)例示了基于垂直投影的子区域划分方法的步骤流程图。图7(b)例示了基于垂直投影的子区域划分处理中的、X-Y坐标轴中的待处理文本行的示意图。图7(c)例示了在基于垂直投影的子区域划分处理中的划分出子区域的待处理文本行的示意图。图8例示了在基于垂直投影的子区域划分处理中的每一列前景像素的数量分布直方图。图9(a)例示了基于线段的主方向来确定子区域的文本方向的方法步骤流程图。图9(b)例示了一个子区域的示意图。图9(c)例示了提取出图9(b)所示的子区域中的全部线段后的示意图。图10(a)例示了基于长线检测来确定子区域的文本方向的方法步骤流程图。图10(b)例示了两个相邻子区域中线段的位置关系。图11(a)例示了确定待处理文本行中与文本行接触的线的方法步骤流程图。图11(b)例示了子区域中的像素列沿着子区域的文本方向进行投影的示意图。图11(c)例示了位于相邻两个字符间隔的线。图12例示了前景像素数量分布的波形图。图13例示了符间线的示意图。图14(a)例示了下划线去除前字符与其连接的线的示意图。图14(b)例示了字符与线接触的结点的示意图。图14(c)例示了去除线且保留字符笔划的示意图。图15例示了执行本专利技术第一实施例后去除了线的文本行的示意图。图16例示了本专利技术第二实施例中的文档图像处理装置的硬件结构示意图。图17例示了本专利技术第二实施例中的文档图像处理装置的软件结构示意图。具体实施方式以下将结合附图来详细描述本专利技术的各种示例性实施方式。应当理解,本专利技术并不局限于下文所述的各种示例性实施方式。另外,作为解决本专利技术的问题的方案,并不需要包括所有的示例性实施方式中描述的特征的组合。在现有技术中,线性变形的文本行经过预处理后可成为水平或垂直的文本行,此时,通过将文本行中的前景像素(或背景像素)相对于X轴或Y轴进行投影,可识别出与文本行接触的线(如下划线),进而可以执行去除与文本行接触的线的处理。但是,对于非线性变形的文本行而言,由于文本行的方向是非线性变化的(没有规律的),因此,如果针对非线性变形后的文本行中的前景像素(或背景像素)仍相对于某一直线(如X轴、Y轴)进行投影的话,则很难准确地确定出与文本行接触的线。有鉴于此,本专利技术实施例不像传统技术那样以X轴或Y轴为基准对文本行中的前景像素进行投影来检测出要去除的线,而是先将文本行划分为多个子区域,确定出子区域中文本的方向,对子区域中的前景像素以该子区域的文本方向为基准进行投影,进而确定出子区域中位于相邻字符空白间隔处的线,最终利用这些字符间隔处的线,构造出与文本行接触的完整的线并去除。本文档来自技高网
...

【技术保护点】
1.一种文档图像处理方法,所述文档图像中包括与线接触的文本行,所述文档图像处理方法包括:将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;根据子区域中包含的字符和与字符接触的线的方向来确定该子区域的文本方向;利用确定出的子区域的文本方向来确定待处理文本行中与文本行接触的线。

【技术特征摘要】
1.一种文档图像处理方法,所述文档图像中包括与线接触的文本行,所述文档图像处理方法包括:将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;根据子区域中包含的字符和与字符接触的线的方向来确定该子区域的文本方向;利用确定出的子区域的文本方向来确定待处理文本行中与文本行接触的线。2.根据权利要求1所述的文档图像处理方法,其中,该方法还包括:对所述文本图像执行预处理,并从中确定出待处理文本行。3.根据权利要求1所述的文档图像处理方法,其中,该方法还包括:去除确定出的线。4.根据权利要求1至3任一所述的文档图像处理方法,其中,所述文档图像为非线性变形的图像、线性变形的图像或没有变形的图像。5.根据权利要求1所述的文档图像处理方法,其中,将待处理文本行划分为多个子区域具体包括:确定待处理文本行中同一像素列上的顶部像素和底部像素之间的距离;过滤顶部像素和底部像素之间的距离满足设定条件的像素列;基于过滤后的像素列中的顶部像素和底部像素之间的距离来确定子区域的尺寸参数;从待处理文本行中的像素列中选择多个像素列的中心点作为子区域的中心;基于确定的子区域的尺寸参数和子区域的中心划分出多个子区域。6.根据权利要求1所述的文档图像处理方法,其中,将待处理文本行划分为多个子区域具体包括:确定待处理文本行中各像素列中前景像素的数量;确定像素列组,该像素列组中的各像素列是相邻像素列,且每个像素列中的前景像素的数量小于第一数量;确定相邻的像素列组之间存在前景像素的数量大于第二数量的像素列的多个像素列组,从确定出的每个像素列组中确定一个像素列作为子区域的左右边界;将左右边界之间的有前景像素的第一像素行和最后一像素行作为上下边界;基于确定出的左右边界和上下边界划分出子区域。7.根据权利要求1所述的文档图像...

【专利技术属性】
技术研发人员:李娇凤罗兆海
申请(专利权)人:佳能株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1