基于OCR的图片数据识别方法、装置、及计算机设备制造方法及图纸

技术编号：23315622 阅读：16 留言：0更新日期：2020-02-11 17:59

本发明专利技术公开了基于OCR的图片数据识别方法、装置、计算机设备及存储介质。该方法包括将待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新得到标准化待识别图片集；获取各标准化待识别图片分别对应的图片类型；通过图像识别获取各标准化待识别图片中指定区域分别对应的识别数值；将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值。该方法实现了将非正向图片均进行旋转得到标准正向图片后，通过图像识别技术识别发票金额和进行核算，提高了核算效率，而且计算准确率高。

OCR based image data recognition method, device and computer equipment

全部详细技术资料下载

【技术实现步骤摘要】
基于OCR的图片数据识别方法、装置、及计算机设备
本专利技术涉及图像识别
，尤其涉及一种基于OCR的图片数据识别方法、装置、计算机设备及存储介质。
技术介绍
在财务报销的时候，报销人员需要填写报销表格和粘贴发票，然后由财务人员审核、计算发票的金额和表格中金额是否一致，发票金额必须>＝表格中所报销的金额才能进行后续报销流程。目前，已出现了在线的办公协同系统，其中也存在在线报销的功能模块。用户在系统上报销时需填写报销信息，并上传报销所提供发票的扫描文件。但是财务人员在使用在线报销的功能模块时，报销人员所填写的报销信息，以及扫描文件均只是保存于在线的办公协同系统的服务器中以供用户查询历史数据，并未利用其中的信息进行金额的自动核算，仍需人工根据报销表格和所粘贴发票核算，而人工核算的过程比较繁琐，这就导致核算效率低下，而且易出错。
技术实现思路
本专利技术实施例提供了一种基于OCR的图片数据识别方法、装置、计算机设备及存储介质，旨在解决现有技术中在线的办公协同系统的线报销的功能模块中，报销人员所填写的报销信息，以及扫描文件均只是保存以供用户查询历史数据，仍需人工根据报销表格和所粘贴发票核算，而人工核算的过程比较繁琐，导致核算效率低下，而且易出错的问题。第一方面，本专利技术实施例提供了一种基于OCR的图片数据识别方法，其包括：接收上传端所上传的待识别图片集；将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；>获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及将所述实际总和值发送至上传端。第二方面，本专利技术实施例提供了一种基于OCR的图片数据识别装置，其包括：图片集接收单元，用于接收上传端所上传的待识别图片集；图片标准化单元，用于将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；图片类型获取单元，用于获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；识别数值获取单元，用于通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；总数据表获取单元，用于获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；求和单元，用于将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及和值发送单元，用于将所述实际总和值发送至上传端。第三方面，本专利技术实施例又提供了一种计算机设备，其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的基于OCR的图片数据识别方法。第四方面，本专利技术实施例还提供了一种计算机可读存储介质，其中所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于OCR的图片数据识别方法。本专利技术实施例提供了一种基于OCR的图片数据识别方法、装置、计算机设备及存储介质。该方法实现了将非正向图片均进行旋转得到标准正向图片后，通过图像识别技术识别发票金额和进行核算，提高了核算效率，而且计算准确率高。附图说明为了更清楚地说明本专利技术实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本专利技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的基于OCR的图片数据识别方法的应用场景示意图；图2为本专利技术实施例提供的基于OCR的图片数据识别方法的流程示意图；图3为本专利技术实施例提供的基于OCR的图片数据识别方法的另一流程示意图；图4a为本专利技术实施例提供的基于OCR的图片数据识别方法中非正向图片的示意图；图4b为本专利技术实施例提供的基于OCR的图片数据识别方法中标准正向图片的示意图；图5为本专利技术实施例提供的基于OCR的图片数据识别方法的子流程示意图；图6为本专利技术实施例提供的基于OCR的图片数据识别装置的示意性框图；图7为本专利技术实施例提供的基于OCR的图片数据识别装置的另一示意性框图；图8为本专利技术实施例提供的基于OCR的图片数据识别装置的子单元示意性框图；图9为本专利技术实施例提供的计算机设备的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图，对本专利技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本专利技术一部分实施例，而不是全部的实施例。基于本专利技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本专利技术保护的范围。应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解，在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解，在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。请参阅图1和图2，图1为本专利技术实施例提供的基于OCR的图片数据识别方法的应用场景示意图；图2为本专利技术实施例提供的基于OCR的图片数据识别方法的流程示意图，该基于OCR的图片数据识别方法应用于服务器中，该方法通过安装于服务器中的应用软件进行执行。如图2所示，该方法包括步骤S110～S170。S110、接收上传端所上传的待识别图片集。在本实施例中，具体的应用场景为财务报销时，需操作上传端(如智能手机、平板电本文档来自技高网...

【技术保护点】
1.一种基于OCR的图片数据识别方法，其特征在于，包括：/n接收上传端所上传的待识别图片集；/n将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；/n获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；/n通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；/n获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；/n将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及/n将所述实际总和值发送至上传端。/n

【技术特征摘要】
1.一种基于OCR的图片数据识别方法，其特征在于，包括：
接收上传端所上传的待识别图片集；
将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集；
获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型；其中，所述图片类型包括对应于增值税专用发票或增值税普通发票的第一图片类型，对应于机打发票的第二图片类型，对应于定额发票的第三图片类型；
通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值；
获取所述标准化待识别图片集中各图片类型的图片张数以得到图片总张数，根据各图片类型的图片张数创建对应行数的子数据表以组成总数据表；
将各标准化待识别图片对应的识别数值分别填充至对应的子数据表中进行存储，对各子数据表的识别数值分别求和再累加求和，得到与总数据表对应的实际总和值；以及
将所述实际总和值发送至上传端。

2.根据权利要求1所述的基于OCR的图片数据识别方法，其特征在于，所述将所述实际总和值发送至上传端之后，还包括：
接收上传端所上传的目标数值；
判断所述实际总和值是否小于所述目标数值；
若所述实际总和值大于或等于所述目标数值，将用于通知审核通过的第一通知信息发送至上传端；
若所述实际总和值小于所述目标数值，将用于通知审核未通过的第二通知信息发送至上传端。

3.根据权利要求1所述的基于OCR的图片数据识别方法，其特征在于，所述将所述待识别图片集中非正向图片均进行旋转得到标准正向图片，以更新所述待识别图片集得到标准化待识别图片集之前，还包括：
判断所述待识别图片集中是否存在非正向图片；若所述待识别图片集中存在非正向图片，执行根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度的步骤；若所述待识别图片集中不存在非正向图片，执行获取所述标准化待识别图片集中各标准化待识别图片分别对应的图片类型的步骤；
根据非正向图片对应的首行文字的位置与对应的标准正向图片中相同文字对应位置获取旋转角度。

4.根据权利要求3所述的基于OCR的图片数据识别方法，其特征在于，所述判断所述待识别图片集中是否存在非正向图片，包括：
通过图像识别获取待识别图片集中各待识别图片的首行文字，若有待识别图片的首行文字不包括预先设置的第一关键词列表中的关键词，将对应的待识别图片作为非正向图片。

5.根据权利要求1-4任一项所述的基于OCR的图片数据识别方法，其特征在于，所述通过图像识别获取所述标准化待识别图片集中各标准化待识别图片中预设的指定区域分别对应的识别数值，包括：
获取所述标准...

【专利技术属性】
技术研发人员：张杰，
申请(专利权)人：深圳壹账通智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人