图像识别方法、装置及计算机可读存储介质制造方法及图纸

技术编号:34320697 阅读:56 留言:0更新日期:2022-07-31 00:08
本申请公开了一种图像识别方法、装置及计算机可读存储介质。涉及金融科技领域,该方法包括:获取待识别发票的发票图像;基于发票图像,确定待识别发票中字符的字符高度;根据字符高度,确定发票图像中的表格框架,其中,表格框架表征发票图像中待识别发票的表格的轮廓信息;基于表格框架,对发票图像进行图像分割,得到目标图像区域;识别目标图像区域中的字符,生成图像识别结果。通过本申请,解决了现有技术中人工识别发票信息所存在的识别效率低的问题。的问题。的问题。

【技术实现步骤摘要】
图像识别方法、装置及计算机可读存储介质


[0001]本申请涉及金融科技领域,具体而言,涉及一种图像识别方法、装置及计算机可读存储介质。

技术介绍

[0002]在企业运营中,工作人员在出差时所产生的差旅费用以及在举办活动时所产生的活动费用通常需要报销,报销的依据则是费用发票,例如,增值税专票。
[0003]但是在现有技术中,工作人员在进行费用报销时,需要人工识别发票上的发票信息,例如,增值税专票上的发票代码以及发票号码,然后再将发票信息人工录入到费用报销系统中。这种人工识别发票信息的方式,不仅识别效率低,而且容易出现识别错误的问题,从而影响到整体的费用报销流程。
[0004]针对上述问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请的主要目的在于提供一种图像识别方法、装置及计算机可读存储介质,以解决现有技术中人工识别发票信息所存在的识别效率低的问题。
[0006]为了实现上述目的,根据本申请的一个方面,提供了一种图像识别方法。该方法包括:获取待识别发票的发票图像;基于发票图像,确定待识别发票中字符的字符高度;根据字符高度,确定发票图像中的表格框架,其中,表格框架表征发票图像中待识别发票的表格的轮廓信息;基于表格框架,对发票图像进行图像分割,得到目标图像区域;识别目标图像区域中的字符,生成图像识别结果。
[0007]进一步地,图像识别方法还包括:在获取待识别发票的发票图像之后,检测发票图像是否存在倾斜;在发票图像存在倾斜的情况下,对发票图像进行倾斜校正处理,得到校正后的第一发票图像。
[0008]进一步地,图像识别方法还包括:对发票图像进行二值化处理以及降噪处理,得到第二发票图像;对第二发票图像中的边缘线条进行增强处理,得到第三发票图像,其中,边缘线条为待识别发票中用于包围字符的线条;对第三发票图像进行霍夫变换,得到待识别发票在发票图像中的倾斜角;根据倾斜角对第三发票图像进行旋转,得到第一发票图像。
[0009]进一步地,图像识别方法还包括:基于第一发票图像,获取待识别发票中的所有字符;计算每个字符的高度值,得到待识别发票中的每个字符的字符高度。
[0010]进一步地,图像识别方法还包括:步骤一、在第一发票图像中随机确定一个目标像素;步骤二、将目标像素与第一像素连接,其中,第一像素与目标像素相邻,并且第一像素的像素值与目标像素的像素值相同;步骤三、在所有的第一像素以及目标像素全部连接之后,确定生成一个字符;步骤四、基于第一发票图像中的其他像素,重复执行步骤一、步骤二以及步骤三,直至所有像素值相同的相邻像素全部连接,得到待识别发票中的所有字符,其中,其他像素为第一发票图像中除目标像素以及第一像素之外的像素,并且其他像素的像
素值与目标像素的像素值相同。
[0011]进一步地,图像识别方法还包括:根据每个字符的字符高度,确定最高字符高度;根据最高字符高度确定水平结构元以及垂直结构元;通过水平结构元提取第一发票图像中的水平等高线,得到水平等高线图;通过垂直结构元提取第一发票图像中的垂直等高线,得到垂直等高线图;将水平等高线图与垂直等高线图进行加权合并,得到合并后的图像,其中,合并后的图像中包含表格框架。
[0012]进一步地,图像识别方法还包括:基于表格框架,确定每条垂直等高线的第一顶点坐标以及每条水平等高线的第二顶点坐标,其中,第一顶点坐标为每条垂直等高线的上下两个端点的坐标,第二顶点坐标为每条水平等高线的左右两个端点的坐标;根据第一顶点坐标以及第二顶点坐标,确定表格框架中的每个子表格框架的坐标信息,其中,每个子表格框架由多条垂直等高线以及多条水平等高线组成;根据每个子表格框架的坐标信息对发票图像进行图像分割,得到目标图像区域,其中,目标图像区域中包含至少一个子表格框架,并且至少一个子表格框架内包含有字符信息。
[0013]为了实现上述目的,根据本申请的另一方面,提供了一种图像识别装置。该装置包括:获取模块,用于获取待识别发票的发票图像;第一确定模块,用于基于发票图像,确定待识别发票中字符的字符高度;第二确定模块,用于根据字符高度,确定发票图像中的表格框架,其中,表格框架表征发票图像中待识别发票的表格的轮廓信息;图像分割模块,用于基于表格框架,对发票图像进行图像分割,得到目标图像区域;识别模块,用于识别目标图像区域中的字符,生成图像识别结果。
[0014]为了实现上述目的,根据本申请的另一方面,提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的图像识别方法。
[0015]为了实现上述目的,根据本申请的另一方面,提供了一种电子设备,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述的图像识别方法。
[0016]通过本申请的技术方案,采用根据字符高度,确定发票图像中的表格框架,并基于表格框架,对发票图像进行图像分割的方式,首先获取待识别发票的发票图像,然后基于发票图像,确定待识别发票中字符的字符高度,并根据字符高度,确定发票图像中的表格框架,从而基于表格框架,对发票图像进行图像分割,得到目标图像区域,最后识别目标图像区域中的字符,生成图像识别结果。其中,表格框架表征发票图像中待识别发票的表格的轮廓信息。
[0017]由上述内容可知,在本申请中,通过识别目标图像区域中的字符,自动识别得到了发票上的发票信息,与现有技术中需要人工识别发票上的发票信息相比,本申请不仅仅提高了发票信息的识别效率,还可以避免由于人工识别失误导致的发票信息识别错误的问题。另外,本申请在识别发票图像上的字符之前,还首先要确定待识别发票中字符的字符高度,然后根据字符高度确定发票图像中的表格框架。需要注意到的是,由于发票中的字符通常是位于表格框架之内,因此,通过字符高度,本申请可以准确地确定表格框架,从而避免了需要工作人员多次试验才能确定表格框架的问题,进而进一步的提高了发票信息的识别效率。
[0018]由此可见,通过本申请的技术方案,达到了自动化识别发票信息的目的,从而实现了提高发票信息识别准确度的效果,进而解决了现有技术中人工识别发票信息所存在的识别效率低的问题。
附图说明
[0019]构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0020]图1是根据本申请实施例提供的图像识别方法的流程图;
[0021]图2是根据本申请实施例提供的发票识别报销系统的示意图;
[0022]图3是根据本申请实施例提供的倾斜的发票样本的发票图像的示意图;
[0023]图4是根据本申请实施例提供的第二发票图像的示意图;
[0024]图5是根据本申请实施例提供的第三发票图像的示意图;
[0025]图6是根据本申请实施例提供的第一发票图像的示意图;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取待识别发票的发票图像;基于所述发票图像,确定所述待识别发票中字符的字符高度;根据所述字符高度,确定所述发票图像中的表格框架,其中,所述表格框架表征所述发票图像中待识别发票的表格的轮廓信息;基于所述表格框架,对所述发票图像进行图像分割,得到目标图像区域;识别所述目标图像区域中的字符,生成图像识别结果。2.根据权利要求1所述的方法,其特征在于,在获取待识别发票的发票图像之后,所述方法还包括:检测所述发票图像是否存在倾斜;在所述发票图像存在倾斜的情况下,对所述发票图像进行倾斜校正处理,得到校正后的第一发票图像。3.根据权利要求2所述的方法,其特征在于,在所述发票图像存在倾斜的情况下,对所述发票图像进行倾斜校正处理,得到校正后的第一发票图像,包括:对所述发票图像进行二值化处理以及降噪处理,得到第二发票图像;对所述第二发票图像中的边缘线条进行增强处理,得到第三发票图像,其中,所述边缘线条为所述待识别发票中用于包围字符的线条;对所述第三发票图像进行霍夫变换,得到所述待识别发票在所述发票图像中的倾斜角;根据所述倾斜角对所述第三发票图像进行旋转,得到所述第一发票图像。4.根据权利要求2所述的方法,其特征在于,确定所述待识别发票中字符的字符高度,包括:基于所述第一发票图像,获取所述待识别发票中的所有字符;计算每个字符的高度值,得到所述待识别发票中的每个字符的字符高度。5.根据权利要求4所述的方法,其特征在于,基于所述第一发票图像,获取所述待识别发票中的所有字符,包括:步骤一、在所述第一发票图像中随机确定一个目标像素;步骤二、将所述目标像素与第一像素连接,其中,所述第一像素与目标像素相邻,并且所述第一像素的像素值与所述目标像素的像素值相同;步骤三、在所有的所述第一像素以及所述目标像素全部连接之后,确定生成一个字符;步骤四、基于所述第一发票图像中的其他像素,重复执行步骤一、步骤二以及步骤三,直至所有像素值相同的相邻像素全部连接,得到所述待识别发票中的所有字符,其中,所述其他像素为所述第一发票图像中除所述目标像素以及所述第一像素之外的像素,并且所述其他像素的像素值与所述目标像素的像素值相同。6.根据权利要求4所述的方法,其特征在于,根据...

【专利技术属性】
技术研发人员:杨剑杨昊泽
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1