一种融合文字颜色先验的票据文本检测方法技术

技术编号:34402662 阅读:56 留言:0更新日期:2022-08-03 21:44
本发明专利技术公开了一种融合文字颜色先验的票据文本检测方法,该检测方法为:利用图像分割的方法获取图像的“文字

【技术实现步骤摘要】
一种融合文字颜色先验的票据文本检测方法


[0001]本专利技术属于文本识别
,具体涉及一种融合文字颜色先验的票据文本检测方法。

技术介绍

[0002]近年来,深度学习技术迅猛发展,被应用于各个实际场景当中。在图像识别方面,基于深度学习的文本检测方法被业界广泛采用。
[0003]票据的文本内容包含两类字段:一是后来打印上去的票据内容,即字段值,字体颜色一般为蓝色;二是没有打印内容的字段值的空票据上的内容,即字段名,字体颜色一般为黑色。在实际业务需求中,往往还需要对检测出来的字段值与字段名进行匹配。然而由于打印偏移的问题,票据上的字段值与字段名常常出现距离太近,甚至重叠的情况,导致了字段名与字段值的检测框粘连问题,将字段名与字段值划分到同一检测框,给字段匹配带来了困难。

技术实现思路

[0004]本专利技术的目的是根据上述现有技术的不足之处,提供一种融合文字颜色先验的票据文本检测方法,该票据文本检测方法通过图像分割的方法获取票据图像的“文字

非文字”分割图以及“蓝色像素区域

非蓝色像素区域”分割图,并基于以上两种分割图计算黑色文本分割图与蓝色文本分割图,根据各文本分割图中文本区域的连通域获取文本检测框。
[0005]本专利技术目的实现由以下技术方案完成:一种融合文字颜色先验的票据文本检测方法,其特征在于所述检测方法包括以下步骤:S1:扫描获取票据图像;S2:利用图像分割的方法,获取所述票据图像的“文字

非文字”分割图B/>t
以及“蓝色像素区域

非蓝色像素区域”分割图B
b
;其中,“文字

非文字”分割图B
t
是指将所述票据图像分割为文字区域和非文字区域两部分,“蓝色像素区域

非蓝色像素区域”分割图B
b
是指将所述票据图像分割为蓝色文本像素附近区域和非蓝色像素区域两部分;S3:通过逻辑运算公式,将“文字

非文字”分割图B
t
与“蓝色像素区域

非蓝色像素区域”分割图B
b
转换为黑色文本分割图B
black
和蓝色文本分割图B
blue
;所述逻辑运算公式为:B
blue
=B
t
∧B
b
;B
black
=B
t

B
b
;其中,∧表示与操作;

表示异或操作;S4:计算黑色文本分割图B
black
中每一个连通域的边框,以获得黑色字段的文本检测框;计算蓝色文本分割图B
blue
中每一个连通域的边框,以获得字段值检测框。
[0006]步骤S2中获取所述票据图像的“文字

非文字”分割图B
t
的方法包括以下步骤:基于深度学习的方式,使用金字塔网络提取出图像特征,基于所述图像特征利用全卷积网络
对所述票据图像进行语义分割,网络输出所述票据图像中每个像素点是文字的概率,以获得“文字

非文字”分割图B
t

[0007]步骤S2中获取所述票据图像的“蓝色像素区域

非蓝色像素区域”分割图B
b
的方法包括以下步骤:基于深度学习的方式,使用图像分割网络对所述票据图像进行语义分割,将所述票据图像的像素分为蓝色文本像素附近区域和非蓝色像素区域两部分,以获得“蓝色像素区域

非蓝色像素区域”分割图B
b

[0008]步骤S4中,获取黑色文本分割图B
black
中所述文本检测框的方法为:使用基于光栅扫描的二值图像轮廓提取算法获得黑色文本分割图B
black
中连通域的边界,以取得能够包围所述边界的最小矩形作为最终的所述文本检测框。
[0009]步骤S4中,获取蓝色文本分割图B
blue
中所述字段值检测框的方法为:使用基于光栅扫描的二值图像轮廓提取算法获得蓝色文本分割图B
blue
中连通域的边界,以取得能够包围所述边界的最小矩形作为最终的所述字段值检测框。
[0010]本专利技术的优点是:通过融合文字颜色信息,将文本检测框分为字段名检测框与字段值检测框两类,有效解决了票据文本检测当中不同类别文字粘连的问题。
附图说明
[0011]图1为本专利技术中融合文字颜色先验的票据文本检测方法流程示意图;图2为本专利技术中票据图像的示意图;图3为本专利技术中“文字

非文字”分割图示意图;图4为本专利技术中“蓝色像素区域

非蓝色像素区域”分割示意图;图5为本专利技术中蓝色文字分割图示意图;图6为本专利技术中黑色文字分割图示意图;图7为本专利技术中蓝色文本检测框示意图;图8为本专利技术中黑色文本检测框示意图。
具体实施方式
[0012]以下结合附图通过实施例对本专利技术的特征及其它相关特征作进一步详细说明,以便于同行业技术人员的理解:实施例:如图1

8所示,本实施例具体涉及一种融合文字颜色先验的票据文本检测方法,该票据文本检测方法包括以下步骤:S1:如图2所示为存在蓝色字打印偏移现象的票据,利用图像扫描设备扫描获取票据图像并上传进行处理。
[0013]其中,实心字体代表黑色文字,是票据中的字段名;横条纹字体代表蓝色文字,是票据中的字段值。蓝色字存在打印偏移现象,与票据上的表格不完全对齐。由于打印偏移,票据图像中的一个字段值“L路北面”与一个字段名“浇筑方式”位置紧贴,如果在文本检测过程中不利用文字颜色先验,容易将二者归为同一个文本检测框当中,给实际业务中后续的字段匹配带来困难。
[0014]S2:利用图像分割的方法,获取票据图像的“文字

非文字”分割图B
t
以及“蓝色像素区域

非蓝色像素区域”分割图B
b

如图3所示,“文字

非文字”分割图B
t
是指将票据图像分割为文字区域和非文字区域两部分,“文字

非文字”分割图中白色表示本实施例中的票据图像中文字所在位置。对比图2可知:本实施例中,票据图像中的一个字段值“L路北部”和一个字段名“浇筑方式”出现粘连,体现为在“文字

非文字“二值图B
t
中,这两个字段的分割区域合为同一个连通域。如果不加处理,这两个字段将被划分到同一个文本检测框当中。使用文字颜色先验信息可以解决这个问题。获取票据图像的“文字

非文字”分割图B
t
的方法包括以下步骤:基于深度学习的方式,使用金字塔网络提取出图像特征,基于图像特征利用全卷积网络对票据图像进行语义本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种融合文字颜色先验的票据文本检测方法,其特征在于所述检测方法包括以下步骤:S1:扫描获取票据图像;S2:利用图像分割的方法,获取所述票据图像的“文字

非文字”分割图B
t
以及“蓝色像素区域

非蓝色像素区域”分割图B
b
;其中,“文字

非文字”分割图B
t
是指将所述票据图像分割为文字区域和非文字区域两部分,“蓝色像素区域

非蓝色像素区域”分割图B
b
是指将所述票据图像分割为蓝色文本像素附近区域和非蓝色像素区域两部分;S3:通过逻辑运算公式,将“文字

非文字”分割图B
t
与“蓝色像素区域

非蓝色像素区域”分割图B
b
转换为黑色文本分割图B
black
和蓝色文本分割图B
blue
;所述逻辑运算公式为:B
blue
=B
t
∧B
b
;B
black
=B
t

B
b
;其中,∧表示与操作;

表示异或操作;S4:计算黑色文本分割图B
black
中每一个连通域的边框,以获得黑色字段的文本检测框;计算蓝色文本分割图B
blue
中每一个连通域的边框,以获得字段值检测框。2.根据权利要求1所述的一种融合文字颜色先验的票据文本...

【专利技术属性】
技术研发人员:徐国栋刘峥李厚荣聂磊冯江宇朱克宏谢钦方刘杨
申请(专利权)人:中铁二十四局集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1