一种图像处理方法、装置、设备及存储介质制造方法及图纸

技术编号:29026351 阅读:16 留言:0更新日期:2021-06-26 05:27
本申请提供一种图像处理方法、装置、设备及存储介质,该方法包括:获取待处理图像,其中,待处理图像中包括票据图像,根据第一要素集合,确定待处理图像中包括的第一要素,对包括第一要素的目标区域进行光学字符识别OCR,确定第一要素的特征,根据第一要素的特征和关联特征,确定目标区域中与第一要素关联的至少一个第二要素,根据第一要素和至少一个第二要素,识别票据图像中的要素语义信息,可见,该图像处理方法无需提前建立票据模板数据库,有效减少了票据图像处理的前期准备工作的工作量,解决了现有技术中基于票据模板数据库对票据识别信息进行定位并识别的流程较为繁琐的技术问题,有效改善了票据图像处理技术的适应性。性。性。

【技术实现步骤摘要】
一种图像处理方法、装置、设备及存储介质


[0001]本申请涉及图像处理
,尤其涉及一种图像处理方法、装置、设备及存储介质。

技术介绍

[0002]银行等各财务部门在处理发票数据的工作过程中,由于票据数量庞大,而且后期的监督业务中,还需要重新录入同样的数据采用传统的手工录入的方式不仅浪费时间和人力,而且容易出错,显然,这种传统的手工录入的方式已经无法满足目前的正常业务需求。由于模式识别技术的不断深入发展,以及市场需求的不断增长,使得票据数据识别和分析技术已经成为金融业务自动化处理的关键。
[0003]现有技术中,通常首先建立票据模板数据库,根据预先建立的票据模板数据库确定待处理票据的票据类型,从而实现对待处理票据中需要识别的信息进行定位并识别。
[0004]采用现有技术,需要提前建立票据模板数据库,当已知的票据类型种类较多时,若采用现有技术进行票据图像处理,则会增加前期准备工作的工作量,当出现新的票据类型时,还需要建立新类型的票据模板,显然,目前的票据图像处理技术的适应性较差。

技术实现思路

[0005]本申请提供一种图像处理方法、装置、设备及存储介质,以解决现有技术中基于票据模板数据库对票据识别信息进行定位并识别的流程较为繁琐的技术问题。
[0006]本申请第一个方面提供一种图像处理方法,包括:
[0007]获取待处理图像;其中,所述待处理图像中包括票据图像;
[0008]根据第一要素集合,确定所述待处理图像中包括的第一要素;
[0009]对包括所述第一要素的目标区域进行光学字符识别OCR,确定所述第一要素的特征;
[0010]根据所述第一要素的特征和关联特征,确定所述目标区域中与所述第一要素关联的至少一个第二要素;
[0011]根据所述第一要素和所述至少一个第二要素,识别所述票据图像中的要素语义信息。
[0012]可选地,所述关联特征,包括:
[0013]所述第一要素的位置和至少一个第二要素的位置之间的对应关系、所述第一要素的内容和所述第二要素的内容之间的对应关系。
[0014]可选地,所述根据第一要素集合,确定所述待处理图像中包括的第一要素之前,还包括:
[0015]将所述待处理图像进行缩放处理;
[0016]基于设置所述图像的颜色通道的值,去除所述待处理图像的背景,获得去背景后的待处理图像;
[0017]将所述去背景后的待处理图像进行去除红印处理,获得去红印后的待处理图像。
[0018]可选地,所述根据第一要素集合,确定所述待处理图像中包括的第一要素之前,还包括:
[0019]对所述去红印后的待处理图像进行灰度处理,获得灰度图像;
[0020]对所述灰度图像进行高斯滤波处理,获得高斯滤波后的灰度图像;
[0021]基于阈值图像,对所述高斯滤波后的灰度图像进行二值化操作,获得二值图像。
[0022]可选地,所述根据第一要素集合,确定所述待处理图像中包括的第一要素之前,还包括:
[0023]基于直线分割检测法LSD,对所述灰度图像进行直线检测,获得直线图像;
[0024]根据所述直线图像,确定待删除直线;
[0025]对所述待删除直线进行删除处理。
[0026]可选地,所述根据第一要素集合,确定所述待处理图像中包括的第一要素之前,还包括:
[0027]对所述二值图像进行去噪处理,获得去噪后的待处理图像;
[0028]对所述去噪后的待处理图像进行形态学操作,获得所述第一要素的目标区域。
[0029]可选地,所述根据第一要素集合,确定所述待处理图像中包括的第一要素之前,还包括:
[0030]基于垂直投影和行分析方法,判断所述去噪后的待处理图像是否需要进行旋转。
[0031]可选地,所述根据所述第一要素的特征和关联特征,确定所述目标区域中与所述第一要素关联的至少一个第二要素,包括:
[0032]基于光学字符识别OCR技术,对所述目标区域进行OCR识别,获得所述至少一个第二要素的语义信息。
[0033]本申请第二个方面提供一种图像处理装置,包括:
[0034]获取模块,用于获取待处理图像;其中,所述待处理图像中包括票据图像;
[0035]确定模块,用于根据第一要素集合,确定所述待处理图像中包括的第一要素;
[0036]第一识别模块,用于对包括所述第一要素的目标区域进行光学字符识别OCR,确定所述第一要素的特征;
[0037]定位模块,用于根据所述第一要素的特征和关联特征,确定所述目标区域中与所述第一要素关联的至少一个第二要素;
[0038]第二识别模块,用于根据所述第一要素和所述至少一个第二要素,识别所述票据图像中的要素语义信息。
[0039]可选地,所述关联特征,包括:
[0040]所述第一要素的位置和至少一个第二要素的位置之间的对应关系、所述第一要素的内容和所述第二要素的内容之间的对应关系。
[0041]可选地,该装置还包括处理模块,处理模块,具体用于:
[0042]将所述待处理图像进行缩放处理;
[0043]基于设置所述图像的颜色通道的值,去除所述待处理图像的背景,获得去背景后的待处理图像;
[0044]将所述去背景后的待处理图像进行去除红印处理,获得去红印后的待处理图像。
[0045]可选地,处理模块还用于,对所述去红印后的待处理图像进行灰度处理,获得灰度图像;
[0046]对所述灰度图像进行高斯滤波处理,获得高斯滤波后的灰度图像;
[0047]基于阈值图像,对所述高斯滤波后的灰度图像进行二值化操作,获得二值图像。
[0048]可选地,处理模块还用于,基于直线分割检测法LSD,对所述灰度图像进行直线检测,获得直线图像;
[0049]根据所述直线图像,确定待删除直线;
[0050]对所述待删除直线进行删除处理。
[0051]可选地,处理模块还用于,对所述二值图像进行去噪处理,获得去噪后的待处理图像;
[0052]对所述去噪后的待处理图像进行形态学操作,获得所述第一要素的目标区域。
[0053]可选地,处理模块还用于,基于垂直投影和行分析方法,判断所述去噪后的待处理图像是否需要进行旋转。
[0054]可选地,第二识别模块具体用于,基于光学字符识别OCR技术,对所述目标区域进行OCR识别,获得所述至少一个第二要素的语义信息。
[0055]本申请第三个方面提供一种电子设备,包括:至少一个处理器和存储器;
[0056]所述存储器存储计算机执行指令;
[0057]所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一个方面以及第一个方面各种可能的设计所述的方法。
[0058]本申请第四个方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,用于票据信息识别,其特征在于,包括:获取待处理图像;其中,所述待处理图像中包括票据图像;根据第一要素集合,确定所述待处理图像中包括的第一要素;对包括所述第一要素的目标区域进行光学字符识别OCR,确定所述第一要素的特征;根据所述第一要素的特征和关联特征,确定所述目标区域中与所述第一要素关联的至少一个第二要素;根据所述第一要素和所述至少一个第二要素,识别所述票据图像中的要素语义信息。2.根据权利要求1所述的方法,其特征在于,所述关联特征,包括:所述第一要素的位置和至少一个第二要素的位置之间的对应关系、所述第一要素的内容和所述第二要素的内容之间的对应关系。3.根据权利要求1所述的方法,其特征在于,所述根据第一要素集合,确定所述待处理图像中包括的第一要素之前,还包括:将所述待处理图像进行缩放处理;基于设置所述图像的颜色通道的值,去除所述待处理图像的背景,获得去背景后的待处理图像;将所述去背景后的待处理图像进行去除红印处理,获得去红印后的待处理图像。4.根据权利要求3所述的方法,其特征在于,所述根据第一要素集合,确定所述待处理图像中包括的第一要素之前,还包括:对所述去红印后的待处理图像进行灰度处理,获得灰度图像;对所述灰度图像进行高斯滤波处理,获得高斯滤波后的灰度图像;基于阈值图像,对所述高斯滤波后的灰度图像进行二值化操作,获得二值图像。5.根据权利要求4所述的方法,其特征在于,所述根据第一要素集合,确定所述待处理图像中包括的第一要素之前,还包括:基于直线分割检测法LSD,对所述灰度图像进行直线检测,获得直线图像;根据所述直线图像,确定待删除直线;对所述待删除直线进行删除处理。6.根据权利要求4所述的方法,其特征在于,所述根据第一要...

【专利技术属性】
技术研发人员:李黄薇李健伟汪雄颜钦钦
申请(专利权)人:北大方正信息产业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1