【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种非标准格式房产证识别方法、装置、设备及存储介质。
技术介绍
1、目前,银行对房产证材料进行审核时,推出了机器人流程自动化(roboticprocess automation,rpa)技术,该项技术结合光学字符识别(optical characterrecognition,ocr)算法,实现了用户房产材料的智能化审核及录入,工作人员只需输入少量的信息,纸质材料扫描上传审批系统即可,后台数字员工rpa会进行自动化审核及录入。这种方式极大提高了工作人员的工作效率,同时也大大缩减了房产材料审核周期,给用户提供了更优质的服务。
2、但是,在实践中发现审批系统中上传的房产材料中可能包括非房产证影像文件,并且老旧房产证有油污等污染和盖章等干扰,因此现有的ocr算法对于房产证相关的图像信息识别准确率相对较低,亟需一种有效的技术手段对ocr算法的识别结果进行优化。
技术实现思路
1、本专利技术提供了一种非标准格式房产证识别方法、装置、设备及存储介质,提供了一种从众多房产证和非标准房产证影像文件中智能识别提取房产证信息的方式,相比于现有技术依靠单一的ocr算法确定识别结果的方式而言,可以提高房产证材料的识别准确性,由此可以释放更多的人力资源,提升房产证材料审批业务的处理效率。
2、根据本专利技术的一方面,提供了一种非标准格式房产证识别方法,所述方法包括:
3、获取审批业务系统中预先上传的房产证材料,采用ocr算法,对所述房产证材料下
4、如果所述房产证文件对应的类型为不动产权证,则采用ocr算法获取所述房产证文件对应的房屋详址,并识别所述房产证文件对应的目标属性信息;
5、如果所述房产证文件对应的类型为除房地证、房权证、不动产权证之外的其他类型,则根据预设的相似度算法确定所述房产证文件对应的房屋详址,并识别所述房产证文件对应的目标属性信息;
6、统计获取的所有房屋详址,并根据统计结果,确定所述房产证材料对应的目标房屋详址。
7、可选的,提取每份房产证文件中的房产证号,包括:
8、根据预设的不同房产证类型对应的不同字符串,提取每份房产证文件中的房产证号;
9、其中,所述字符串中包括房产证类型以及预设分隔符。
10、可选的,根据预设的相似度算法确定所述房产证文件对应的房屋详址,包括:
11、获取所述ocr算法对所述房产证文件识别的第一房屋详址,获取房产证属性表中当前记录的第二房屋详址;
12、确定所述第一房屋详址与预设地址关键词之间的第一相似度,确定第二房屋详址与预设地址关键词之间的第二相似度;
13、如果所述第一相似度大于第二相似度,则将所述第一房屋详址作为房产证属性表中的当前房屋详址。
14、可选的,识别所述房产证文件对应的目标属性信息,包括:
15、识别所述房产证文件对应的土地性质、套内面积、建筑面积、土地使用终止日、卖房人证件号以及卖房人名称。
16、可选的,识别所述房产证文件对应的土地使用终止日,包括:
17、获取所述ocr算法对所述房产证文件识别的原始土地使用终止日,将所述原始土地使用终止日中的关键字进行替换;
18、对替换后的终止日进行正则匹配,并根据正则匹配结果确定所述房产证文件对应的目标土地使用终止日。
19、可选的,统计获取的所有房屋详址,并根据统计结果,确定所述房产证材料对应的目标房屋详址,包括:
20、将获取的所有房屋详址存放在详址集合中,统计所述详址集合中每个房屋详址对应的出现次数;
21、判断出现次数最高的房屋详址条数是否为一条;
22、若是,则将所述出现次数最高的房屋详址,作为所述房产证材料对应的目标房屋详址;
23、若否,则根据预设的相似度算法确定各所述出现次数最高的房屋详址,与预设地址关键词之间的相似度;
24、根据所述相似度,确定所述房产证材料对应的目标房屋详址。
25、可选的,根据所述相似度,确定所述房产证材料对应的目标房屋详址,包括:
26、判断相似度最高的房屋详址条数是否为一条;
27、若是,则将所述相似度最高的房屋详址,作为所述房产证材料对应的目标房屋详址;
28、若否,则获取相似度最高的第一条房屋详址,并将所述相似度最高的第一条房屋详址,作为所述房产证材料对应的目标房屋详址。
29、根据本专利技术的另一方面,提供了一种非标准格式房产证识别装置,所述装置包括:
30、文件遍历模块,用于获取审批业务系统中预先上传的房产证材料,采用ocr算法,对所述房产证材料下的所有房产证文件进行遍历,并提取每份房产证文件中的房产证号;
31、属性识别模块,用于如果所述房产证文件对应的类型为不动产权证,则采用ocr算法获取所述房产证文件对应的房屋详址,并识别所述房产证文件对应的目标属性信息;
32、所述属性识别模块,还用于如果所述房产证文件对应的类型为除房地证、房权证、不动产权证之外的其他类型,则根据预设的相似度算法确定所述房产证文件对应的房屋详址,并识别所述房产证文件对应的目标属性信息;
33、房屋详址确定模块,用于统计获取的所有房屋详址,并根据统计结果,确定所述房产证材料对应的目标房屋详址。
34、根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
35、至少一个处理器;以及
36、与所述至少一个处理器通信连接的存储器;其中,
37、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的非标准格式房产证识别方法。
38、根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的非标准格式房产证识别方法。
39、本专利技术实施例提供的技术方案,通过获取审批业务系统中预先上传的房产证材料,采用ocr算法对房产证材料下的所有房产证文件进行遍历,提取每份房产证文件中的房产证号,如果房产证文件对应的类型为不动产权证,则采用ocr算法获取房产证文件对应的房屋详址,并识别房产证文件对应的目标属性信息,如果房产证文件对应的类型为除房地证、房权证、不动产权证之外的其他类型,则根据预设的相似度算法确定房产证文件对应的房屋详址,并识别房产证文件对应的目标属性信息,统计获取的所有房屋详址,根据统计结果确定房产证材料对应的目标房屋详址的技术手段,提供了一种从众多房产证和非标准房产证影像文件中智能识别提取房产证信息的方式,相比于现有技术依靠单一的ocr算法确定识别结果的方式而言,可以提高房产证材料的识别准确性本文档来自技高网...
【技术保护点】
1.一种非标准格式房产证识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,提取每份房产证文件中的房产证号,包括:
3.根据权利要求1所述的方法,其特征在于,根据预设的相似度算法确定所述房产证文件对应的房屋详址,包括:
4.根据权利要求1所述的方法,其特征在于,识别所述房产证文件对应的目标属性信息,包括:
5.根据权利要求4所述的方法,其特征在于,识别所述房产证文件对应的土地使用终止日,包括:
6.根据权利要求1所述的方法,其特征在于,统计获取的所有房屋详址,并根据统计结果,确定所述房产证材料对应的目标房屋详址,包括:
7.根据权利要求6所述的方法,其特征在于,根据所述相似度,确定所述房产证材料对应的目标房屋详址,包括:
8.一种非标准格式房产证识别装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实
...【技术特征摘要】
1.一种非标准格式房产证识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,提取每份房产证文件中的房产证号,包括:
3.根据权利要求1所述的方法,其特征在于,根据预设的相似度算法确定所述房产证文件对应的房屋详址,包括:
4.根据权利要求1所述的方法,其特征在于,识别所述房产证文件对应的目标属性信息,包括:
5.根据权利要求4所述的方法,其特征在于,识别所述房产证文件对应的土地使用终止日,包括:
6.根据权利要求1所述的方法,其特征在于...
【专利技术属性】
技术研发人员:吴令,华莹,龚南书,徐峰,谢淏,陈万毅,
申请(专利权)人:重庆银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。