【技术实现步骤摘要】
基于智能分类的资产查重方法、系统、设备及计算机可读存储介质
[0001]本专利技术涉及索引检索
,具体地,公开了一种基于智能分类的资产查重方法、系统、设备及计算机可读存储介质。
技术介绍
[0002]近几年来,应收账款等动产抵押相关业务在银行兴起。此类资产的特点是一个资产包会有成千上万笔小资产,单纯靠人工去核查资产是否有被重复登记,成本过高,几乎不具可行性。因此必须借助计算机进行资产查重。大部分的资产登记文件都是图片,所以计算机首先会对资产登记文件进行光学字符识别,把图片转化成文本。业务员会去使用一些关键词去搜索文本,一个资产登记文件文本中如果包含这些关键词,就表示该资产已经被登记了,是重复资产。由于光学字符识别技术的局限性,往往会造成部分图片文字没有被识别出来,如果这些文字没有识别出来,业务员使用关键词搜索就有可能会遗漏一些资产。同时,由于在进行资产登记的过程中,登记人对于资产的文字描述可以在一定范围内进行自由发挥,没有固定格式限制,容易导致即使文本部分内容被完全识别,但是仍无法通过常见的或是通用的关键词对其进行成功 ...
【技术保护点】
【技术特征摘要】
1.一种基于智能分类的资产查重方法,其特征在于,用于根据资产登记文件进行重复资产查询;于所述资产查重方法执行前,预先设定多项资产描述项,每个所述资产描述项对应一类需要查询的所述资产类型;所述资产查重方法包括如下步骤:根据所述资产登记文件,进行文字识别以获取对应的文字识别结果;根据所述资产描述项,逐一对所述文字识别结果进行匹配检索,以获取所述资产登记文件对应的识别分类信息,所述识别分类信息关联于所述资产描述项;在接收到来自外部的查询指令的情况下,根据所述查询指令逐一对所述资产描述项进行匹配搜索,以获取关联于符合所述匹配搜索的所述资产描述项的所述识别分类信息,并记为匹配查询结果;获取不包含符合所述匹配搜索的所述资产描述项的所述资产登记文件,并记为待校验查询结果;所述重复资产查询的结果包括所述匹配查询结果和所述待校验查询结果。2.如权利要求1所述的资产查重方法,其特征在于,在根据所述资产登记文件,进行文字识别以获取对应的文字识别结果,还包括:获取所述资产登记文件对应的原始图像使用光学字符识别引擎对所述原始图像进行字符识别,获取对应的可识别字符;所述文字识别结果包括全部所述可识别字符。3.如权利要求1所述的资产查重方法,其特征在于,所述资产描述项包括但不限于发票号资产类型、应收账款资产类型、企业名称资产主体中的至少一种或多种。4.如权利要求1所述的资产查重方法,其特征在于,根据所述资产描述项逐一对所述文字识别结果进行匹配检索以获取所述资产登记文件对应的识别分类信息的过程中,还包括:根据预设次序从所述资产描述项中选取一项作为匹配检索项;根据所述匹配检索项对所述文字识别结果进行遍历检索以获取关联于所述匹配检索项的所述文字识别结果;重复上述步骤直至全部所述资产描述项获取关联的所述文字识别结果,并记为所述资产登记文件对应的所述识别分类信息。5.如权利要求1所述的资产查重方法,其特征在于,每个所述资产描述项对应一组所述识别分类信息;所述识别分类信息包括所述识别分类信息对应的所述资产描述项,所述识别分类信息的具体匹配内容,所述具体匹配内容对应的所述资产登记文件以及所述具体匹配内容对应的资产主体;所述识别分类信息的具体匹配内容源于根据所述资...
【专利技术属性】
技术研发人员:吕永,
申请(专利权)人:上海聚均科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。