一种数据处理方法及相关设备技术

技术编号:23239500 阅读:14 留言:0更新日期:2020-02-04 18:43
本申请实施例提供了一种数据处理方法及相关设备,不但可以识别影像质量较高的发票,同时也可以识别影像质量较低的发票,提高发票的识别效率,减少人工损耗。该方法包括:获取目标图像,所述目标图像为待识别详细信息的特定格式的发票图像;基于所述目标图像,通过目标要素识别模型识别所述目标图像对应的多个要素信息,所述目标要素识别模型与所述多个要素信息相对应;根据所述多个要素信息确定所述目标图像的详细信息。

A data processing method and related equipment

【技术实现步骤摘要】
一种数据处理方法及相关设备
本申请涉及信息处理领域,尤其涉及一种数据处理方法及相关设备。
技术介绍
商务运动的发展催生了发票的迅速发展,用传统纸质发票记账需要手工输入发票信息,容易出错,处理需要消耗大量的人力和时间。目前提供的大多数发票识别方式,均是基于光学字符识别(OpticalCharacterRecognition,ORC)技术实现。ORC技术是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。但是通过这种方式对发票进行识别时,对待识别的发票图像质量有较高的要求,对清晰、完整以及无模糊污损的发票可以识别,但是对于影像质量不高的发票往往是无法识别的。
技术实现思路
本申请提供了一种数据处理方法及相关设备,不但可以识别影像质量较高的发票,同时也可以识别影像质量较低的发票,提高发票的识别效率,减少人工损耗。本申请实施例第一方面提供一种数据处理方法,所述方法包括:获取目标图像,所述目标图像为待识别详细信息的特定格式的发票图像;基于所述目标图像,通过目标要素识别模型识别所述目标图像对应的多个要素信息,所述目标要素识别模型与所述多个要素信息相对应;根据所述多个要素信息确定所述目标图像的详细信息。可选地,所述多个要素信息包括号码要素信息、代码要素信息、日期要素信息以及第一类别要素信息,所述基于所述目标图像,通过要素识别模型识别所述目标图像对应的多个要素信息包括:确定所述号码要素信息对应的号码截图、所述代码要素信息对应的代码截图、所述日期要素信息对应的日期截图以及所述第一类别要素信息对应的第一截图,所述号码截图、所述代码截图、所述日期截图以及所述第一截图均包含于所述目标图像;基于所述号码截图、所述代码截图、所述日期截图以及所述第一截图,通过所述目标识别模型识别所述目标图像的号码信息、代码信息、日期信息以及第一类别信息,所述第一类别信息为所述目标图像中的校验码信息或所述目标图像中的不含税金额信息。可选地,所述确定所述第一类别要素信息对应的第一截图包括:确定所述目标图像中的特征截图;基于所述特征截图,通过特征识别模型确定所述目标图像的类别,所述特征识别模型与所述特征截图相对应,所述第一类别信息与所述目标图像的类别相对应;根据所述目标图像的类别确定所述第一截图。可选地,所述获取目标图像包括:接收终端发送的初始图像;将所述初始图像转换为特定格式,得到所述目标图像。可选地,所述将所述初始图像转换为特定格式,得到所述目标图像包括:判断所述初始图像的高度是否大于所述初始图像的宽度;若所述初始图像的高度大于所述初始图像的宽度,则将所述初始图像按照第一规则进行旋转得到第一图像;确定所述第一图像的特定特征对应的特定特征截图;判断所述特定特征截图是否处于目标区域,所述目标区域为所述第一图像对应的N个象限中的特定区域,其中,N为大于或等于2的正整数;若所述特定特征截图处于所述目标区域,则将所述第一图像进行格式调整得到所述目标图像;若所述特定特征截图不处于所述目标区域,则将所述第一图像按照第二规则进行旋转,并将旋转后的所述第一图像进行格式调整得到所述目标图像,其中,所述第一规则与所述第二规则为不同的选择规则。可选地,所述方法还包括:步骤1)确定多个图像中每个图像对应的号码截图、代码截图、日期截图以及目标要素截图;步骤2)初始化要素识别模型;步骤3)基于第二图像对应的第一号码截图、第一代码截图、第一日期截图以及第二截图,通过初始化后所述要素识别模型得到所述第二图像对应的号码信息、代码信息、日期信息以及第二类别信息,所述第二图像为所述多个图像中的任意一个图像,所述第一号码截图、所述第一代码截图、所述第一日期截图以及所述第二截图均包含于所述第二图像;步骤4)更新所述要素识别模型的损失函数;迭代执行步骤3)至步骤4),直至达到预置的迭代终止条件,且将达到所述预置的迭代终止条件的所述要素识别模型确定为所述目标要素识别模型。可选地,所述方法还包括:创建卷积神经网络,其中,所述卷积神经网络至少包括具有最大化池的卷积成、包含有特定节点数的隐藏层以及包含有指定数量的输出层;将所述卷积神经网络填充至目标模型框架得到所述要素识别模型。可选地,所述方法还包括:判断迭代次数是否达到预置数值,若是,则确定达到所述预置的迭代终止条件;或,判断所述损失函数是否收敛,若是,则确定达到所述预置的迭代终止条件。本申请实施例第二方面提供了一种数据处理装置,包括:获取单元,用于获取目标图像,所述目标图像为待识别详细信息的特定格式的发票图像;识别单元,用于基于所述目标图像,通过目标要素识别模型识别所述目标图像对应的多个要素信息,所述目标要素识别模型与所述多个要素信息相对应;确定单元,用于根据所述多个要素信息确定所述目标图像的详细信息。可选地,所述多个要素信息包括号码要素信息、代码要素信息、日期要素信息以及第一类别要素信息,所述识别单元具体用于:确定所述号码要素信息对应的号码截图、所述代码要素信息对应的代码截图、所述日期要素信息对应的日期截图以及所述第一类别要素信息对应的第一截图,所述号码截图、所述代码截图、所述日期截图以及所述第一截图均包含于所述目标图像;基于所述号码截图、所述代码截图、所述日期截图以及所述第一截图,通过所述目标识别模型识别所述目标图像的号码信息、代码信息、日期信息以及第一类别信息,所述第一类别信息为所述目标图像中的校验码信息或所述目标图像中的不含税金额信息。可选地,所述识别单元确定所述第一类别要素信息对应的第一截图包括:确定所述目标图像中的特征截图;基于所述特征截图,通过特征识别模型确定所述目标图像的类别,所述特征识别模型与所述特征截图相对应,所述第一类别信息与所述目标图像的类别相对应;根据所述目标图像的类别确定所述第一截图。可选地,所述获取单元具体用于:接收终端发送的初始图像;将所述初始图像转换为特定格式,得到所述目标图像。可选地,所述获取单元将所述初始图像转换为特定格式,得到所述目标图像包括:判断所述初始图像的高度是否大于所述初始图像的宽度;若所述初始图像的高度大于所述初始图像的宽度,则将所述初始图像按照第一规则进行旋转得到第一图像;确定所述第一图像的特定特征对应的特定特征截图;判断所述特定特征截图是否处于目标区域,所述目标区域为所述第一图像对应的N个象限中的特定区域,其中,N为大于或等于2的正整数;若所述特定特征截图处于所述目标区域,则将所述第一图像进行格式调整得到所述目标图像;若所述特定特征截图不处于所述目标区域,则将所述第一图像按照第二规则本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取目标图像,所述目标图像为待识别详细信息的特定格式的发票图像;/n基于所述目标图像,通过目标要素识别模型识别所述目标图像对应的多个要素信息,所述目标要素识别模型与所述多个要素信息相对应;/n根据所述多个要素信息确定所述目标图像的详细信息。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取目标图像,所述目标图像为待识别详细信息的特定格式的发票图像;
基于所述目标图像,通过目标要素识别模型识别所述目标图像对应的多个要素信息,所述目标要素识别模型与所述多个要素信息相对应;
根据所述多个要素信息确定所述目标图像的详细信息。


2.根据权利要求1所述的方法,其特征在于,所述多个要素信息包括号码要素信息、代码要素信息、日期要素信息以及第一类别要素信息,所述基于所述目标图像,通过要素识别模型识别所述目标图像对应的多个要素信息包括:
确定所述号码要素信息对应的号码截图、所述代码要素信息对应的代码截图、所述日期要素信息对应的日期截图以及所述第一类别要素信息对应的第一截图,所述号码截图、所述代码截图、所述日期截图以及所述第一截图均包含于所述目标图像;
基于所述号码截图、所述代码截图、所述日期截图以及所述第一截图,通过所述目标识别模型识别所述目标图像的号码信息、代码信息、日期信息以及第一类别信息,所述第一类别信息为所述目标图像中的校验码信息或所述目标图像中的不含税金额信息。


3.根据权利要求2所述的方法,其特征在于,所述确定所述第一类别要素信息对应的第一截图包括:
确定所述目标图像中的特征截图;
基于所述特征截图,通过特征识别模型确定所述目标图像的类别,所述特征识别模型与所述特征截图相对应,所述第一类别信息与所述目标图像的类别相对应;
根据所述目标图像的类别确定所述第一截图。


4.根据权利要求1至3中任一项所述的方法,其特征在于,所述获取目标图像包括:
接收终端发送的初始图像;
将所述初始图像转换为特定格式,得到所述目标图像。


5.根据权利要求4所述的方法,其特征在于,所述将所述初始图像转换为特定格式,得到所述目标图像包括:
判断所述初始图像的高度是否大于所述初始图像的宽度;
若所述初始图像的高度大于所述初始图像的宽度,则将所述初始图像按照第一规则进行旋转得到第一图像;
确定所述第一图像的特定特征对应的特定特征截图;
判断所述特定特征截图是否处于目标区域,所述目标区域为所述第一图像对应的N个象限中的特定区域,其中,N为大于或等于2的正整数;
若所述特定特征截图处于...

【专利技术属性】
技术研发人员:张庆
申请(专利权)人:深圳金蝶账无忧网络科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1