一种数据处理方法及相关设备技术

技术编号：23239500 阅读：14 留言：0更新日期：2020-02-04 18:43

本申请实施例提供了一种数据处理方法及相关设备，不但可以识别影像质量较高的发票，同时也可以识别影像质量较低的发票，提高发票的识别效率，减少人工损耗。该方法包括：获取目标图像，所述目标图像为待识别详细信息的特定格式的发票图像；基于所述目标图像，通过目标要素识别模型识别所述目标图像对应的多个要素信息，所述目标要素识别模型与所述多个要素信息相对应；根据所述多个要素信息确定所述目标图像的详细信息。

A data processing method and related equipment

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法及相关设备
本申请涉及信息处理领域，尤其涉及一种数据处理方法及相关设备。
技术介绍
商务运动的发展催生了发票的迅速发展，用传统纸质发票记账需要手工输入发票信息，容易出错，处理需要消耗大量的人力和时间。目前提供的大多数发票识别方式，均是基于光学字符识别(OpticalCharacterRecognition，ORC)技术实现。ORC技术是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。但是通过这种方式对发票进行识别时，对待识别的发票图像质量有较高的要求，对清晰、完整以及无模糊污损的发票可以识别，但是对于影像质量不高的发票往往是无法识别的。
技术实现思路
本申请提供了一种数据处理方法及相关设备，不但可以识别影像质量较高的发票，同时也可以识别影像质量较低的发票，提高发票的识别效率，减少人工损耗。本申请实施例第一方面提供一种数据处理方法，所述方法包括：获取目标图像，所述目标图像为待识别详细信息的特定格式的发票图像；基于所述目标图像，通过目标要素识别模型识别所述目标图像对应的多个要素信息，所述目标要素识别模型与所述多个要素信息相对应；根据所述多个要素信息确定所述目标图像的详细信息。可选地，所述多个要素信息包括号码要素信息、代码要素信息、日期要素信息以及第一类别要素信息，所述基于所述目标图像，通过要素识别模型识别所述目标图像对应的多个要素信息包...

【技术保护点】
1.一种数据处理方法，其特征在于，包括：/n获取目标图像，所述目标图像为待识别详细信息的特定格式的发票图像；/n基于所述目标图像，通过目标要素识别模型识别所述目标图像对应的多个要素信息，所述目标要素识别模型与所述多个要素信息相对应；/n根据所述多个要素信息确定所述目标图像的详细信息。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：
获取目标图像，所述目标图像为待识别详细信息的特定格式的发票图像；
基于所述目标图像，通过目标要素识别模型识别所述目标图像对应的多个要素信息，所述目标要素识别模型与所述多个要素信息相对应；
根据所述多个要素信息确定所述目标图像的详细信息。

2.根据权利要求1所述的方法，其特征在于，所述多个要素信息包括号码要素信息、代码要素信息、日期要素信息以及第一类别要素信息，所述基于所述目标图像，通过要素识别模型识别所述目标图像对应的多个要素信息包括：
确定所述号码要素信息对应的号码截图、所述代码要素信息对应的代码截图、所述日期要素信息对应的日期截图以及所述第一类别要素信息对应的第一截图，所述号码截图、所述代码截图、所述日期截图以及所述第一截图均包含于所述目标图像；
基于所述号码截图、所述代码截图、所述日期截图以及所述第一截图，通过所述目标识别模型识别所述目标图像的号码信息、代码信息、日期信息以及第一类别信息，所述第一类别信息为所述目标图像中的校验码信息或所述目标图像中的不含税金额信息。

3.根据权利要求2所述的方法，其特征在于，所述确定所述第一类别要素信息对应的第一截图包括：
确定所述目标图像中的特征截图；
基于所述特征截图，通过特征识别模型确定所述目标图像的类别，所述特征识别模型与所述特征截图相对应，所述第一类别信息与所述目标图像的类别相对应；
根据所述目标图像的类别确定所述第一截图。

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述获取目标图像包括：
接收终端发送的初始图像；
将所述初始图像转换为特定格式，得到所述目标图像。

5.根据权利要求4所述的方法，其特征在于，所述将所述初始图像转换为特定格式，得到所述目标图像包括：
判断所述初始图像的高度是否大于所述初始图像的宽度；
若所述初始图像的高度大于所述初始图像的宽度，则将所述初始图像按照第一规则进行旋转得到第一图像；
确定所述第一图像的特定特征对应的特定特征截图；
判断所述特定特征截图是否处于目标区域，所述目标区域为所述第一图像对应的N个象限中的特定区域，其中，N为大于或等于2的正整数；
若所述特定特征截图处于...

【专利技术属性】
技术研发人员：张庆，
申请(专利权)人：深圳金蝶账无忧网络科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人