智能防漏的资产查重方法、系统、设备及计算机可读存储介质技术方案

技术编号:33244881 阅读:30 留言:0更新日期:2022-04-27 17:54
本发明专利技术提供了一种智能防漏的资产查重方法、系统、设备和计算机可读存储介质。通过本申请提出的技术方案,能够利用光学字符识别结果对识别出来的字符进行坐标位置的确定,并据此获取光学字符识别结果对应的识别文字分布情况和空白区域分布情况,进而对于基于光学字符识别结果获取的空白区域在原始图像的基础上进行位置分布判断和像素色彩分布判断,进而得出上述空白区域中是否存在可能遗漏识别的情况,并对出现可能遗漏识别情况的区域进行二次文字识别以防止遗漏识别和资产遗漏查询的情况产生,具有可推广价值。具有可推广价值。具有可推广价值。

【技术实现步骤摘要】
智能防漏的资产查重方法、系统、设备及计算机可读存储介质


[0001]本专利技术涉及图像识别
,具体地,公开了一种智能防漏的资产查重方法、系统、设备及计算机可读存储介质。

技术介绍

[0002]近几年来,应收账款等动产抵押相关业务在银行兴起。此类资产的特点是一个资产包会有成千上万笔小资产,单纯靠人工去核查资产是否有被重复登记,成本过高,几乎不具可行性。因此必须借助计算机进行资产查重。大部分的资产登记文件都是图片,所以计算机首先会对资产登记文件进行光学字符识别,把图片转化成文本。业务员会去使用一些关键词去搜索文本,一个资产登记文件文本中如果包含这些关键词,就表示该资产已经被登记了,是重复资产。由于光学字符识别技术的局限性,往往会造成部分图片文字没有被识别出来,如果这些文字没有识别出来,业务员使用关键词搜索就有可能会遗漏一些资产。
[0003]在现有技术中,还可以通过光学字符识别引擎识别出来的字符识别率去合成一个文件的识别率,对于识别率低的文件可以挑选出来让人工进行复核。但由于光学字符识别的字符识别率往往只是针对已经识别出来的字符进行识本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种智能防漏的资产查重方法,其特征在于,用于根据资产登记文件对应的图像数据进行重复资产查询,所述资产查重方法包括如下步骤:获取所述资产登记文件对应的原始图像;根据所述原始图像进行文字识别处理,获取所述资产登记文件对应的第一文字识别结果以及第一文字分布区域;根据所述原始图像进行黑白二值化处理,获取由黑色像素和白色像素组成异色图像;根据所述非第一文字分布区域的分布情况,获取对应的可能漏识别区域;根据所述异色图像的像素分布情况,于所述可能漏识别区域中,获取黑色像素占比值;在所述黑色像素占比值处于预设区间的情况下,根据对应的所述可能漏识别区域进行二次文字识别处理以获取对应的第二文字识别结果;所述重复资产查询的结果包括所述第一文字识别结果和所述第二文字识别结果。2.如权利要求1所述的资产查重方法,其特征在于,在根据所述原始图像进行文字识别处理的过程中,还包括:使用光学字符识别引擎对所述原始图像进行字符识别,获取每个可识别字符于所述原始图像中的坐标信息;根据每个所述可识别字符对应的坐标信息,确定每个所述可识别字符于所述原始图像中的占位区域;所述第一文字识别结果包括每个所述可识别字符对应的字符含义信息;所述第一文字分布区域包括每个所述可识别字符对应的占位区域。3.如权利要求2所述的资产查重方法,其特征在于,所述非第一文字分布区域包括所述原始图像中除每个所述可识别字符对应的占位区域以外的全部区域。4.如权利要求1所述的资产查重方法,其特征在于,在根据所述原始图像进行所述黑白二值化处理的过程中,还包括:将所述原始图像中全部白色像素对应的区域保持不变;将所述原始图像中全部非白色像素对应的区域的每个像素点转变为黑色像素值。5.如权利要求1所述的资产查重方法,其特征在于,在根据所述非第一文字分布区域的分布情况,获取对应的所述可能漏识别区域的过程中,还包括:根据所述非第一文字分布区域的分布情况,将所述非第一文字分布区域划分为多个连续空白区域;判断所述连续空白区域是否处于所述原始图像的边缘区域;判断所述连续空白区域是否处于所述原始图像的段落间隔区域;删除处于所述边缘区域和所述段落间隔区域的所述连续空白区域,并将剩余的所述连续空白区域作为所述可能漏识别区域。6.如权利要求5所述的资产查重方法,...

【专利技术属性】
技术研发人员:吕永
申请(专利权)人:上海聚均科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1