一种海量不动产登记数据异常识别方法技术

技术编号:37536768 阅读:15 留言:0更新日期:2023-05-12 16:05
本发明专利技术公开了一种海量不动产登记数据异常识别方法,本技术方案首先对不动产登记数据进行业务类型分类,利用权属关键词确认登记权属类型,并通过不动产单元关键词确定登记单位位置和登记空间图层,最后将得到的登记数据与中心信息平台的录入信息进行比对,发现异常状态的不动产登记数据,解决原有人工审查的方式效率低下,面对海量的不动产登记数据无法保证数据有效性的技术问题,实现了对海量的不动产登记数据的有效性进行准确判断,高效、精准识别出错误异常数据,克服基于全国不动产登记数据库的数据分析结果准确性和可信性的制约难题,为自然资源业务管理、政策制定、房地产市场调控、抵押金融风险防范等方面提供有效的数据支撑。支撑。支撑。

【技术实现步骤摘要】
一种海量不动产登记数据异常识别方法


[0001]本专利技术涉及大数据处理
,尤其涉及一种海量不动产登记数据异常识别方法。

技术介绍

[0002]不动产登记数据在实际应用中,可以为自然资源业务管理、政策制定、房地产市场调控、抵押金融风险防范等方面提供有效的数据支撑。但由于历史悠久、各地政策不一致,分散登记时期造成的部分历史数据不完整、数据字段缺失、数据填写不规范等问题,导致基于全国不动产登记数据库的数据分析结果准确性和可信性受到制约,进而限制了更多衍生服务功能的发挥。在对不动产登记数据进行利用的过程中,如何发现错误异常的不动产登记数据成为了工作人员的一道难题。
[0003]目前主要是通过人工查找和对比的方式,由各地的地方信息平台对各地的原始不动产登记数据进行录入并上传到中心信息平台,由中心信息平台对原始登记的不动产数据进行人工审查,审核一个,发现一个。但面对海量的不动产登记数据,这种人工审查的方式效率太低,而且人工审核的方式也未能完全保证准确性。现有技术也曾利用文本识别的方式来对不动产登记数据进行识别,但由于各地的不动产登记数据的维度不统一,登记的内容不同,无法对不动产登记数据的有效性进行精准识别。
[0004]随着经济发展而衍生出越来越多的业务,对于不动产登记数据应用的需求也越来越大。因此,如何对各地的地方信息平台上传到中心信息平台的不动产登记数据的有效性进行准确判断,克服基于全国不动产登记数据库的数据分析结果准确性和可信性的制约难题,成为了各大技术厂商亟需解决的技术问题。

技术实现思路

[0005]本专利技术提供了一种海量不动产登记数据异常识别方法,能够对海量的不动产登记数据的有效性进行准确判断,高效、精准识别出错误异常数据,克服基于全国不动产登记数据库的数据分析结果准确性和可信性的制约难题,为自然资源业务管理、政策制定、房地产市场调控、抵押金融风险防范等方面提供有效的数据支撑。
[0006]为了解决上述技术问题,本专利技术实施例提供了一种海量不动产登记数据异常识别方法,应用于中心信息平台,所述方法包括:
[0007]接收由多个地方信息平台上传的不动产登记数据,根据所述不动产登记数据,确定目标不动产的权利人信息;
[0008]对所述不动产登记数据的业务类型进行识别,按照不同的业务类型对所述不动产登记数据进行分类,分别得到多个类型的不动产登记数据;
[0009]根据预先建立的权属关键词,在同一业务类型的不动产登记数据中进行遍历查询,对所述不动产登记数据中的登记权属信息进行提取,确定所述不动产登记数据的登记权属类型;
[0010]根据预先建立的不动产单元关键词,分别对同一登记权属类型所对应的不动产登记数据中存在的所述不动产单元关键词进行识别,根据提取到的不动产单元关键词确定所述不动产登记数据的登记单位位置;
[0011]根据所述不动产登记数据的登记单位位置,确定当前登记单位位置的空间维度关键词,根据所述登记单位位置和所述空间维度关键词,确定当前登记单位位置的登记空间图层;
[0012]根据所述权利人信息在中心信息平台中调用所述目标不动产的录入权属类型、录入单位位置及其录入空间图层,当确定所述录入权属类型、录入单位位置及其录入空间图层,与所述登记权属类型、登记单位位置及其登记空间图层不一致时,确定不动产登记数据为异常状态。
[0013]作为优选方案,所述对所述不动产登记数据的业务类型进行识别,按照不同的业务类型对所述不动产登记数据进行分类,分别得到多个类型的不动产登记数据的步骤中,具体包括:
[0014]对所述不动产登记数据中的头部信息进行截取,将截取得到的头部信息进行解析,得到信息请求编码;
[0015]确定上传所述不动产登记数据的地方信息平台,根据所述地方信息平台预设的解密规则,对所述信息请求编码进行解密,得到信息请求指令;
[0016]在所述中心信息平台中执行所述信息请求指令运行,将运行跳转的业务界面类型作为所述不动产登记数据的业务类型;
[0017]对同一业务类型的不动产登记数据进行集合,得到多个类型的不动产登记数据。
[0018]作为优选方案,所述根据预先建立的权属关键词,在同一业务类型的不动产登记数据中进行遍历查询,对所述不动产登记数据中的登记权属信息进行提取,确定所述不动产登记数据的登记权属类型的步骤中,具体包括:
[0019]提取预先建立的权属关键词,其中,所述权属关键词包括:土地所有权、海域使用权、房地产权、建设用地使用权、构建筑所有权、农用地使用权、林权、地役权和抵押权;
[0020]对所述不动产登记数据中的文字数据进行断词,将所述文字数据分割成多个字词;
[0021]提取预设的基准字词,在分割的字词中确定基准字词的位置;
[0022]计算每个权属关键词与所述基准字词的空间距离,根据所述空间距离和每个权属关键词出现的次数,确定所述不动产登记数据的登记权属类型。
[0023]作为优选方案,所述计算每个权属关键词与所述基准字词的空间距离,根据所述空间距离和每个权属关键词出现的次数,确定所述不动产登记数据的登记权属类型的步骤中,具体包括:
[0024]分别计算每个权属关键词与所述基准字词之间的相隔字数,根据所述相隔字数计算出权属关键词与所述基准字词之间的字节数;
[0025]统计每个权属关键词在分割的字词中出现的次数,根据出现的次数值确定每个权属关键词的权重值;
[0026]将每个权属关键词的权重值与所述字节数相乘得到乘积值,作为登记权属值;
[0027]将登记权属值最大的对应的权属关键词作为所述不动产登记数据的登记权属类
型。
[0028]作为优选方案,所述根据预先建立的不动产单元关键词,分别对同一登记权属类型所对应的不动产登记数据中存在的所述不动产单元关键词进行识别,根据提取到的不动产单元关键词确定所述不动产登记数据的登记单位位置的步骤中,具体包括:
[0029]提取预先建立的不动产单元关键词,其中,所述不动产单元关键词包括:宗地代码、自然栋、逻辑栋、楼层和户号;
[0030]在同一登记权属类型对应分割的字词中,对所述不动产单元关键词进行识别并提取,得到宗地代码序列、自然栋值、逻辑栋值、楼层值和户号值;
[0031]将所述宗地代码序列、自然栋值、逻辑栋值、楼层值和户号值,与预设的不动产单位位置查询指令封装在同一个位置查询请求指令中,并将所述位置查询请求指令发送到第三方查询平台中,以使所述第三方查询平台响应于所述位置查询请求指令而反馈的查询结果信令;
[0032]对所述查询结果信令进行解析,当解析结果为不动产单位位置正常时,将所述宗地代码序列、自然栋值、逻辑栋值、楼层值和户号值作为所述不动产登记数据的登记单位位置;否则,确定所述不动产登记数据为异常状态。
[0033]作为优选方案,将所述宗地代码序列、自然栋值、逻辑栋值、楼层值和户号值,与预设的不动产单位位置查询指令封装在同一个位置查本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种海量不动产登记数据异常识别方法,其特征在于,应用于中心信息平台,所述方法包括:接收由多个地方信息平台上传的不动产登记数据,根据所述不动产登记数据,确定目标不动产的权利人信息;对所述不动产登记数据的业务类型进行识别,按照不同的业务类型对所述不动产登记数据进行分类,分别得到多个类型的不动产登记数据;根据预先建立的权属关键词,在同一业务类型的不动产登记数据中进行遍历查询,对所述不动产登记数据中的登记权属信息进行提取,确定所述不动产登记数据的登记权属类型;根据预先建立的不动产单元关键词,分别对同一登记权属类型所对应的不动产登记数据中存在的所述不动产单元关键词进行识别,根据提取到的不动产单元关键词确定所述不动产登记数据的登记单位位置;根据所述不动产登记数据的登记单位位置,确定当前登记单位位置的空间维度关键词,根据所述登记单位位置和所述空间维度关键词,确定当前登记单位位置的登记空间图层;根据所述权利人信息在中心信息平台中调用所述目标不动产的录入权属类型、录入单位位置及其录入空间图层,当确定所述录入权属类型、录入单位位置及其录入空间图层,与所述登记权属类型、登记单位位置及其登记空间图层不一致时,确定不动产登记数据为异常状态。2.如权利要求1所述的海量不动产登记数据异常识别方法,其特征在于,所述对所述不动产登记数据的业务类型进行识别,按照不同的业务类型对所述不动产登记数据进行分类,分别得到多个类型的不动产登记数据的步骤中,具体包括:对所述不动产登记数据中的头部信息进行截取,将截取得到的头部信息进行解析,得到信息请求编码;确定上传所述不动产登记数据的地方信息平台,根据所述地方信息平台预设的解密规则,对所述信息请求编码进行解密,得到信息请求指令;在所述中心信息平台中执行所述信息请求指令运行,将运行跳转的业务界面类型作为所述不动产登记数据的业务类型;对同一业务类型的不动产登记数据进行集合,得到多个类型的不动产登记数据。3.如权利要求1所述的海量不动产登记数据异常识别方法,其特征在于,所述根据预先建立的权属关键词,在同一业务类型的不动产登记数据中进行遍历查询,对所述不动产登记数据中的登记权属信息进行提取,确定所述不动产登记数据的登记权属类型的步骤中,具体包括:提取预先建立的权属关键词,其中,所述权属关键词包括:土地所有权、海域使用权、房地产权、建设用地使用权、构建筑所有权、农用地使用权、林权、地役权和抵押权;对所述不动产登记数据中的文字数据进行断词,将所述文字数据分割成多个字词;提取预设的基准字词,在分割的字词中确定基准字词的位置;计算每个权属关键词与所述基准字词的空间距离,根据所述空间距离和每个权属关键词出现的次数,确定所述不动产登记数据的登记权属类型。
4.如权利要求3所述的海量不动产登记数据异常识别方法,其特征在于,所述计算每个权属关键词与所述基准字词的空间距离,根据所述空间距离和每个权属关键词出现的次数,确定所述不动产登记数据的登记权属类型的步骤中,具体包括:分别计算每个权属关键词与所述基准字词之间的相隔字数,根据所述相隔字数计算出权属关键词与所述基准字词之间的字节数;统计每个权属关键词在分割的字词中出现的次数,根据出现的次数值确定每个权属关键词的权重值;将每个权属关键词的权重值与所述字节数相乘得到乘积值,作为登记权属值;将登记权属值最大的对应的权属关键词作为所述不动产登记数据的登记权属类型。5.如权利要求3所述的海量不动产登记数据异常识别方法,其特征在于,所述根据预先建立的不动产单元关键词,分别对同一登记权属类型所对应的不动产登记数据中存在的所述不动产单元关键词进行识别,根据提取到的不动产单元关键词确定所述不动产登记数据的登记单位位置的步骤中,具体包括:提取预先建立的不动产单元关键词,其中,所述不动产单元关键词包括:宗地代码、自然栋、逻辑栋、楼层和户号;在同一登记权属类型对应分割的字词中,对所述不动产单元关键词进行识别并提取,得到宗地代码序列、自然栋值、逻辑栋值、楼层值和户号值;将所述宗地代码序列、自然栋值、逻辑栋值、楼层值和户...

【专利技术属性】
技术研发人员:贾文珏贾萍张俊逸张倩孙中孝谈夭林张菲菲李彦刘皓宇武宇廷
申请(专利权)人:中国农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1