凭证信息遗漏识别及处理方法、系统与介质技术方案

技术编号:38103826 阅读:7 留言:0更新日期:2023-07-06 09:23
本发明专利技术提供一种凭证信息遗漏识别及处理方法、系统与介质,属于数据处理技术领域,具体包括:将凭证的校验区域划分为遗漏问题区域和错误问题区域,并至少基于纹理特征和SURF特征确定遗漏问题区域的遗漏评估值,并结合识别准确率得到凭证的遗漏概率,当基于遗漏概率确定不需要总体分析时,通过杰卡德相似系数与马氏距离函数确定错误问题区域与目标图像的相似度,并基于相似度、问题率、遗漏概率确定需要总体分析时,对凭证进行OCR识别得到凭证文字确定是否进行自动补正,基于受票方以及开票方的历史凭证得到凭证的开票校验金额,并基于开票校验金额确定开票金额存在问题时,输出报警信息,从而提升了凭证信息泄露处理的效率以及准确性。确性。确性。

【技术实现步骤摘要】
凭证信息遗漏识别及处理方法、系统与介质


[0001]本专利技术属于数据处理
,尤其涉及一种凭证信息遗漏识别及处理方法、系统与介质。

技术介绍

[0002]随着电子凭证方便快捷以及节约纸张的优势,在越来越多的领域内得到了大量的应用,但与此同时凭证信息有可能会存在一些信息填写错误或者遗漏的地方,因此为了实现对凭证信息的遗漏的自动识别,在专利技术专利授权公告号CN115169284B《基于视觉化分析的凭证信息遗漏填补方法》中通过对凭证信息分析后,对凭证信息的遗漏值处理以及资料视觉化,并且通过选取多种填补方法来比较填补效果,最终选取适合的填补方法,将遗漏的资料处理完成,从而提高了遗漏值处理的效率和准确性,但是却存在以下技术问题:未能结合凭证信息的填写内容进行疑似填写错误的判断,例如某些凭证信息并未存在填写信息的遗漏,但是在实际的操作过程中会有可能存在开票金额或者开票人信息存在异常的情况,若不能结合上述因素,则同样无法准确的实现开票。
[0003]未能对凭证信息的缺失内容进行分析,并根据缺失内容的分析结果进行是否补充的判断,例如在发票类的凭证信息中,若开票金额等涉及到金额信息存在遗漏,由于不同的发票的开票信息并不一致,此时无法进行自动补充,而例如开票方信息等存在遗漏,此时可以进行自动补充,因此若不能结合上述分析结果,则无法准确的实现对遗漏信息的自动填充。
[0004]针对上述技术问题,本专利技术提供了一种凭证信息遗漏识别及处理方法、系统与介质。

技术实现思路

[0005]根据本专利技术的一个方面,提供了一种凭证信息遗漏识别及处理方法。
[0006]一种凭证信息遗漏识别及处理方法,其特征在于,具体包括:S11基于凭证的开票方的历史凭证的错误率和遗漏率以及受票方的历史凭证的错误率进行所述凭证的问题率的确定,并基于所述问题率确定是否需要总体分析,若是,则进入步骤S14,若否,则进入步骤S12;S12将所述凭证换分为多个校验区域,并利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域,并至少基于纹理特征和SURF特征确定所述遗漏问题区域的遗漏评估值,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率,通过所述遗漏概率确定是否需要总体分析,若是,则进入步骤S14,若否,则进入步骤S13;S13基于所述错误问题区域的图像获取所述错误问题区域的灰度共生矩阵,并通过杰卡德相似系数与马氏距离函数确定与目标图像的灰度共生矩阵的相似度,并基于所述相似度、问题率、遗漏概率确定需要总体分析时,进入步骤S14;
S14对所述凭证进行OCR识别得到凭证文字,基于所述凭证文字确定是否进行自动补正,基于受票方以及开票方的历史凭证得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息。
[0007]另一方面,本专利技术提供了一种凭证信息遗漏识别及处理系统,采用上述的一种凭证信息遗漏识别及处理方法,具体包括:问题率确定模块;校验区域划分模块;遗漏概率确定模块;相似度评估模块;报警信息输出模块;其中所述问题率确定模块负责基于凭证的开票方的历史凭证的错误率和遗漏率以及受票方的历史凭证的错误率确定所述凭证的问题率;所述校验区域划分模块负责将所述凭证划分为多个校验区域,并利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域;所述遗漏概率确定模块负责至少基于纹理特征和SURF特征确定所述遗漏问题区域的遗漏评估值,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率;所述相似度评估模块负责基于所述错误问题区域的图像获取所述错误问题区域的灰度共生矩阵,并通过杰卡德相似系数与马氏距离函数确定与目标图像的灰度共生矩阵的相似度,并基于所述相似度、问题率、遗漏概率确定是否需要总体分析;所述自动补正确定模块负责对所述凭证进行OCR识别得到凭证文字,基于所述凭证文字确定所述凭证的遗漏信息类型,通过所述遗漏信息类型确定是否进行自动补正;所述报警信息输出模块负责基于受票方以及开票方的历史凭证、所述凭证类型得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息。
[0008]另一方面,本专利技术提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种凭证信息遗漏识别及处理方法。
[0009]本专利技术的有益效果在于:通过结合凭证的开票方的历史凭证的错误率和遗漏率以及所述受票方的历史凭证的错误率确定是否需要总体分析,从而实现了从开票方的历史凭证的实际情况以及受票方的实际情况对凭证的差异性分析,在保证凭证遗漏识别的准确性的基础上,也进一步提升了凭证识别的效率。
[0010]通过利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域,从而实现了对不同的校验区域的类型的划分,这也为差异性的进行遗漏概率和相似度的确定奠定了基础。
[0011]通过基于纹理特征和SURF特征确定遗漏问题区域的局部遗漏概率,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率,从而实现了从校验区域的图像的识别的角度对遗漏概率的准确评价,不仅实现了从总体的纹理角度以及细节的SURF特征对校验区域的图像特征的表征,进而提升了整体的准确性,并且通过遗漏概率的识别,也保证了存在遗漏可能的凭证的可靠性处理。
[0012]通过基于所述相似度、问题率、遗漏概率确定是否需要总体分析,从而实现了从多角度对凭证的评价,在保证校验效率的同时,也保证了存在问题的凭证能够得到全面的分
析。
[0013]通过基于受票方以及开票方的历史凭证、所述凭证类型得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息,从而实现了对开票金额的错误的在线识别,不仅保证了对凭证的遗漏信息的识别,同时也避免了凭证的开票金额的错误导致的开票信息错误的自动识别,进而保证了凭证的准确性和完整性。
[0014]其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
[0015]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0016]通过参照附图详细描述其示例实施方式,本专利技术的上述和其它特征及优点将变得更加明显;图1是一种凭证信息遗漏识别及处理方法的流程图;图2是基于所述问题率确定是否需要总体分析的具体步骤的流程图;图3是凭证的遗漏概率确定的具体步骤的流程图;图4是开票校验金额确定的具体步骤的流程图;图5是一种基于多维大数据分析的数据处理系统的框架图;图6是另外一种基于多维大数据分析的数据处理系统的框架图。
具体实施方式
[0017]现在将参考附图更全面地描述示例实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种凭证信息遗漏识别及处理方法,其特征在于,具体包括:S11基于凭证的开票方的历史凭证的错误率和遗漏率以及受票方的历史凭证的错误率确定所述凭证的问题率,并基于所述问题率确定是否需要总体分析,若是,则进入步骤S14,若否,则进入步骤S12;S12将所述凭证划分为多个校验区域,并利用开票方的历史凭证和受票方的历史凭证的所述校验区域的遗漏比例、错误比例将所述校验区域划分为遗漏问题区域和错误问题区域,并至少基于纹理特征和SURF特征确定所述遗漏问题区域的遗漏评估值,并结合遗漏问题区域的识别准确率得到所述凭证的遗漏概率,通过所述遗漏概率确定是否需要总体分析,若是,则进入步骤S14,若否,则进入步骤S13;S13基于所述错误问题区域的图像获取所述错误问题区域的灰度共生矩阵,并通过杰卡德相似系数与马氏距离函数确定与目标图像的灰度共生矩阵的相似度,并基于所述相似度、问题率、遗漏概率确定需要总体分析时,进入步骤S14;S14对所述凭证进行OCR识别得到凭证文字,基于所述凭证文字确定是否进行自动补正,基于受票方以及开票方的历史凭证得到所述凭证的开票校验金额,并基于所述开票校验金额确定开票金额存在问题时,输出报警信息。2.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,所述受票方的历史凭证的错误率根据所述受票方的历史凭证的识别情况进行确定,具体的,根据所述受票方的历史凭证的购买方信息的错误情况进行确定,并当所述受票方的历史凭证的错误率大于错误率限定值时,确定需要对所述凭证进行总体分析。3.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,基于所述问题率确定是否需要总体分析,具体包括:基于所述凭证的开票方的历史凭证的错误率确定是否需要总体分析,若是,则需要总体分析,若否,则进入下一步骤;基于所述凭证的开票方的历史凭证的遗漏率确定是否需要总体分析,若是,则需要总体分析,若否,则进入下一步骤;基于所述凭证的开票方的历史凭证的错误率和遗漏率得到所述开票方的开票问题概率,并基于所述开票问题概率确定是否需要进一步的评估,若是,则进入下一步骤,若否,则确定不需要总体分析;基于所述受票方的历史凭证的错误率以及所述开票方的开票问题概率得到问题率,并基于所述问题率确定是否需要总体分析。4.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,在进行凭证的受票方的历史凭证的错误率的确认之前,当所述开票方的历史凭证的数量或者所述受票方的历史凭证的数量小于预设数量时,则直接确定需要进行总体分析。5.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,所述校验区域根据所述凭证的必填信息的区域进行确定,其中所述凭证的必填信息根据所述凭证的凭证类型进行确定。6.如权利要求1所述的凭证信息遗漏识别及处理方法,其特征在于,所述凭证的遗漏概率确定的具体步骤为:S31基于所述遗漏问题区域的图像的SURF特征确定遗漏问题区域的SURF遗漏概率,并
基于所述遗漏问题区域的SURF遗漏概率的最大值确定是否需要总体评估,若是,则需要总体分析,若否,则进入步骤S32;S32基于所述遗漏问题区域的SURF遗漏概率的和确定是否需要进一步分析,若是,则进入步骤S34,若否,则进入步骤S33;S33基于所述遗漏问题区域的SURF遗漏概率以及遗漏问题区域的识别准确率,确定所述凭证的SURF遗漏概率,并基于所述凭证的SURF遗漏概率确定是否需要进一步分析,若是,则进入步骤S34,若否,则无需总体分析;S34将所述遗漏问题区域的图像转换为灰度图...

【专利技术属性】
技术研发人员:谢继雷张涵李耿陈嘉俊
申请(专利权)人:浙江爱信诺航天信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1