票据识别方法、装置、设备及存储介质制造方法及图纸

技术编号:37409946 阅读:12 留言:0更新日期:2023-04-30 09:35
本申请公开了一种票据识别方法、装置、设备及存储介质,该方法包括步骤:获取待识别票据图像;从所述待识别票据图像中识别票据的名称;若识别成功,则基于识别到的名称建立坐标系;基于所述坐标系对所述待识别票据图像中的文字进行定位;基于定位后的文字及所述文字的位置,对所述待识别票据图像进行票据识别。本申请无需对待识别票据图像进行分割,而是利用票据的名称来建立坐标系,以此通过票据中的文字及对应的位置来对待识别票据图像进行票据识别,从而避免了对多张票据图像分割时不准确,进而提高了识别多张票据时的准确性。进而提高了识别多张票据时的准确性。进而提高了识别多张票据时的准确性。

【技术实现步骤摘要】
票据识别方法、装置、设备及存储介质


[0001]本申请涉及图像识别
,尤其涉及一种票据识别方法、装置、设备及存储介质。

技术介绍

[0002]财务事项中经常需要面对多张票据粘贴(例如并排粘贴)在同一张报销单的情况。目前,在面对该情况时,现有技术通过特征匹配的方式对报销单的多张票据图像进行分割,之后分别对分割后的票据图像进行识别。
[0003]然而,通过特征匹配的方式对报销单的多张票据图像进行分割时,存在无法准确匹配特征的情况,使得多张票据图像分割不准确,常见的现象是将两张或两张以上的票据分割在一张票据图像中,导致最后对分割后的票据图像进行票据识别时准确性低。

技术实现思路

[0004]有鉴于此,本申请实施例提供一种票据识别方法、装置、设备及存储介质,旨在提高识别多张票据时的准确性。
[0005]为实现上述目的,本申请提供一种票据识别方法,所述方法包括:
[0006]获取待识别票据图像;
[0007]从所述待识别票据图像中识别票据的名称;
[0008]若识别成功,则基于识别到的名称建立坐标系;
[0009]基于所述坐标系对所述待识别票据图像中的文字进行定位;
[0010]基于定位后的文字及所述文字的位置,对所述待识别票据图像进行票据识别。
[0011]示例性的,所述基于识别到的名称建立坐标系,包括:
[0012]从识别到的名称中选择原点和关键点;
[0013]以所述原点和关键点的连线为坐标轴,并基于所述原点和所述坐标轴建立坐标系。
[0014]示例性的,所述从所述待识别票据图像中识别票据的名称,包括:
[0015]对所述待识别票据图像进行OCR识别,得到票据的内容;
[0016]将所述内容与票据通用名称中的关键字进行比对,得到所述票据的名称。
[0017]示例性的,所述从所述待识别票据图像中识别票据的名称之后,还包括:
[0018]若识别失败,则分割所述票据的内容为多个当前文本片段;
[0019]获取各当前文本片段中各文字的文字坐标;
[0020]基于所述文字坐标确定各文本片段的当前片段坐标;
[0021]基于所述当前片段坐标确定所述票据的类型。
[0022]示例性的,所述基于所述当前片段坐标确定所述票据的类型,包括:
[0023]获取票据模板图像;
[0024]确定所述票据模板图像对应的各模板文本片段,以及所述各模板文本片段对应的
模板片段坐标;
[0025]确定与各票据种类的各预设固定信息相匹配的模板文本片段为模板固定信息;
[0026]确定所述模板固定信息在所述预设固定信息中的占比;若任一票据种类对应的占比大于或等于预设占比阈值,则确定所述票据模板图像中票据模板的票据种类为所述任一票据种类;
[0027]基于预设确定规则从所述模板固定信息的模板片段坐标中获取定位点坐标;
[0028]基于所述定位点坐标确定校正点坐标;
[0029]基于所述定位点坐标和所述校正点坐标,构建所述任一票据种类对应的票据模板模型;
[0030]将所述当前片段坐标与各票据模板模型的模型片段坐标进行匹配,并确定所述票据的类型为匹配到的票据模板模型的类型。
[0031]示例性的,所述基于预设确定规则从所述模板固定信息的模板片段坐标中获取定位点坐标,包括:
[0032]获取所述模板固定信息的类型编号;所述类型编号由人工标注得到;
[0033]对所述模板固定信息的模板片段坐标进行随机组合,得到多个候选组合;各候选组合均包括预设数量的模板片段坐标;
[0034]基于所述多个候选组合和所述类型编号确定定位点坐标。
[0035]示例性的,所述基于所述多个候选组合和所述类型编号确定定位点坐标,包括:
[0036]分别计算各候选组合中各模板片段坐标组成的覆盖区域的面积;
[0037]剔除所述多个候选组合中面积小于或等于预设面积阈值的候选组合;
[0038]计算各剔除后的候选组合的类型编号之和,并将和最小的剔除后的候选组合作为目标候选组合;
[0039]确定所述目标候选组合中的各模板片段坐标为定位点坐标。
[0040]此外,为实现上述目的,本申请还提供一种票据识别装置,所述装置包括:
[0041]第一获取模块,用于获取待识别票据图像;
[0042]第一识别模块,用于从所述待识别票据图像中识别票据的名称;
[0043]建立模块,用于若识别成功,则基于识别到的名称建立坐标系;
[0044]定位模块,用于基于所述坐标系对所述待识别票据图像中的文字进行定位;
[0045]第二识别模块,用于基于定位后的文字及所述文字的位置,对所述待识别票据图像进行票据识别。
[0046]此外,为实现上述目的,本申请还提供一种票据识别设备,所述票据识别设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的票据识别程序,所述票据识别程序被所述处理器执行时实现如上所述的票据识别方法的步骤。
[0047]此外,为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有票据识别程序,所述票据识别程序被处理器执行时实现如上所述的票据识别方法的步骤。
[0048]与现有技术中,在对报销单中多张票据图像进行分割时不准确,导致最后对分割后的票据图像进行票据识别时的准确性低相比,本申请通过获取待识别票据图像;从所述待识别票据图像中识别票据的名称;若识别成功,则基于识别到的名称建立坐标系;基于所
述坐标系对所述待识别票据图像中的文字进行定位;基于定位后的文字及所述文字的位置,对所述待识别票据图像进行票据识别。本申请无需对待识别票据图像进行分割,而是利用票据的名称来建立坐标系,以此通过票据中的文字及对应的位置来对待识别票据图像进行票据识别,从而避免了对多张票据图像分割时不准确,进而提高了识别多张票据时的准确性。
附图说明
[0049]图1是本申请票据识别方法第一实施例的流程示意图;
[0050]图2是本申请票据识别方法中功能模块示意图;
[0051]图3是本申请实施例方案涉及的硬件运行环境的结构示意图。
[0052]本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0053]应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0054]本申请提供一种票据识别方法,参照图1,图1为本申请票据识别方法第一实施例的流程示意图。
[0055]本申请实施例提供了票据识别方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。票据识别方法可应用于终端中,包括移动终端和个人计算机等。为了便于描述,以下省略执行主体描述票据识别方法的各个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种票据识别方法,其特征在于,所述方法包括:获取待识别票据图像;从所述待识别票据图像中识别票据的名称;若识别成功,则基于识别到的名称建立坐标系;基于所述坐标系对所述待识别票据图像中的文字进行定位;基于定位后的文字及所述文字的位置,对所述待识别票据图像进行票据识别。2.如权利要求1所述的方法,其特征在于,所述基于识别到的名称建立坐标系,包括:从识别到的名称中选择原点和关键点;以所述原点和关键点的连线为坐标轴,并基于所述原点和所述坐标轴建立坐标系。3.如权利要求2所述的方法,其特征在于,所述从所述待识别票据图像中识别票据的名称,包括:对所述待识别票据图像进行OCR识别,得到票据的内容;将所述内容与票据通用名称中的关键字进行比对,得到所述票据的名称。4.如权利要求3所述的方法,其特征在于,所述从所述待识别票据图像中识别票据的名称之后,还包括:若识别失败,则分割所述票据的内容为多个当前文本片段;获取各当前文本片段中各文字的文字坐标;基于所述文字坐标确定各文本片段的当前片段坐标;基于所述当前片段坐标确定所述票据的类型。5.如权利要求4所述的方法,其特征在于,所述基于所述当前片段坐标确定所述票据的类型,包括:获取票据模板图像;确定所述票据模板图像对应的各模板文本片段,以及所述各模板文本片段对应的模板片段坐标;确定与各票据种类的各预设固定信息相匹配的模板文本片段为模板固定信息;确定所述模板固定信息在所述预设固定信息中的占比;若任一票据种类对应的占比大于或等于预设占比阈值,则确定所述票据模板图像中票据模板的票据种类为所述任一票据种类;基于预设确定规则从所述模板固定信息的模板片段坐标中获取定位点坐标;基于所述定位点坐标确定校正点坐标;基于所述定位点坐标和所述校正点坐标,构建所述任一票据种类对应的票据模板模型;将所述当前片段坐...

【专利技术属性】
技术研发人员:林彦伊周冰陈昊明
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1