一种不动产存量数据整理方法及其应用技术

技术编号:36817914 阅读:14 留言:0更新日期:2023-03-12 00:36
本发明专利技术涉及互联网领域,特别涉及一种不动产存量数据整理方法及其应用。本发明专利技术具体整理方法流程为,对历史数据库中的不动产存量数据进行存量数据预处理,对预处理后的存量数据进行基于属性特征数据的拆分,对拆分后存量数据的属性特征进行多维度挂接处理,并生成标准化结构数据,批量筛选标准化结构数据中的异常值与缺失值,同时实时与采集的现有数据进行比对,筛选出重复与部分重复的存量数据。本发明专利技术所述的不动产存量数据整理方法,避免后续新的现有数据的录入过程中出现的关联性错误的问题,提高不动产存量数据系统工作的稳定性。提高不动产存量数据系统工作的稳定性。提高不动产存量数据系统工作的稳定性。

【技术实现步骤摘要】
一种不动产存量数据整理方法及其应用


[0001]本专利技术涉及互联网领域,IPC分类号为:G06Q10/06,特别涉及一种不动产存量数据整理方法及其应用。
技术背景
[0002]不动产存量数据是指在指定时间内已经保存至历史数据库中的数据,通常情况下,由于不动产存量数据的固定性以及历史录入能力的局限性,经常存在历史存量数据出现数据完整性较差,数据异常,存量数据与新录入的数据间存在重复或部分重复的问题,从而导致地籍数据的属性特征错误,后期数据流量数据录入时关联错误甚至无法关联的情况发生,但是,传统的存量数据的手动录入方式效率较低,同时人工处理庞大的地籍数据极易出现错误,导致地籍数据在实际使用中出现较多问题。
[0003]专利CN202010449837提供了一种基于多数据获取的不动产测绘与调查方法,此专利通过采集多维度的不动产评估数据,并建立了基于多数据的交叉组合方法从而对不动产的测绘数据进行多方面的评估和校验。专利CN201810361413提供了一种不动产资料上传方法、装置、计算机设备和存储介质,此专利通过设计了一种资料上传的装置,用以提升不动产业务办理的效率,通过在系统中直接录入并查询资料,用以避免虚假信息录入的情况。
[0004]但是上述专利只是针对不动产数据的采集精确度与采集效率进行了一定的优化,并未设计存量数据的纠正与优化问题,同时也无法更好的解决存量数据带来的后续的数据关联性错误的问题,针对上述情况,急需推出一种不动产存量数据整理方法及其应用。

技术实现思路

[0005]针对上述存在的问题,本专利技术提供了一种不动产存量数据整理方法及其应用,具体整理方法流程为:
[0006]S1、对历史数据库中的不动产存量数据进行存量数据预处理;
[0007]S2、对预处理后的存量数据进行基于属性特征数据的拆分;
[0008]S3、对拆分后存量数据的属性特征进行多维度挂接处理,并生成标准化结构数据;
[0009]S4、批量筛选标准化结构数据中的异常值与缺失值,同时实时与采集的现有数据进行比对,筛选出重复与部分重复的存量数据。
[0010]优选的,所述的存量数据预处理,包括离散数据格式统一处理,地址结构化处理,图幅特征提取处理,地籍信息录入处理,图幅位置坐标标定处理。
[0011]优选的,所述的地址结构化处理,建立了结构化格式列表。
[0012]具体的,所述的与现有采集的数据进行对比,用以筛选出历史数据库在地籍数据存储过程中存在的重复存储,或土地分割过程时历史数据库并未更新,造成的现有数据关联失败,属性特征数据重叠的情况发生。
[0013]其中,对重复与部分重复的存量数据首先建立重复关键词查询,并通过设定重复关键词频次,将超出指定关键词频次的存量数据提取,并以时间线为基准,分析该存量数据
中地籍信息变更原因,自动生成地籍信息时间表,通过地籍信息时间表判断地籍的归属信息与权责变更事项,从而保留指定归属信息下的存量数据,删除其余重复部分。
[0014]优选的,所述的结构化格式列表,将地址数据转换为字符串形式,并将字符串形式的数据拆分为数据编号,数据名称,数据类型,以此作为属性数据对地址数据进行分类组合处理,生成统一结构数据。
[0015]优选的,所述的地籍信息录入处理,通过地籍图扫描基线标定与定位偏差拟合处理,实现地籍图的矢量化提取。
[0016]优选的,所述的地籍图扫描基线标定,通过建立基于OCR的图像分扫描方式,以扫描的地籍图进行图像处理与数据拟合,提升OCR扫描的精度。
[0017]优选的,所述的图幅特征提取处理,对存量数据中的图幅地号进行拆分并提取关键词,所述的关键词筛选包括关键词结构拆分,关键词属性拆分和人工校对筛选。
[0018]具体的,由于地籍信息中的图幅通常可分为“图号”“幅号”和“地号”三部分,但是由于各地区与各领域的统计方式不同,所述的图幅特征的格式也有所不同,因此需要进行图幅特征提取处理与结构标准化。
[0019]优选的,所述的多维度挂接处理,具体包括属性特征数据与幢图形数据库挂接,之后进行幢图形数据库数据与宗地图形数据库进行挂接。
[0020]优选的,所述的多维度挂接处理中,建立了基于批量数据统一挂接操作。
[0021]具体的,所述的基于批量数据统一挂接操作,通过建立基于最大后验概率分布计算的地籍信息校验。所述的预挂接信息表中由于自动进行批量信息筛选,可能会存在关联信息缺失与关联错误的情况发生,为了在提高地籍数据多维度挂接处理的效率的同时,提高地籍信息关联精度,在此基础上建立了基于最大后验概率分布计算地籍信息校验。
[0022]优选的,具体应用于不动产地籍数据整理系统的数据处理中。
[0023]与现有技术相比,本贩专利技术的有益效果在于:
[0024](1)本专利技术所述的不动产存量数据整理方法,对历史数据库中的不动产存量数据进行系统化与标准化的整理,将之前在录入过程中由于历史录入能力的局限性导致的数据不完整或数据错误的问题进行补齐和修正,从而避免后续新的现有数据的录入过程中出现的关联性错误的问题,提高不动产存量数据系统工作的稳定性。
[0025](2)在(1)的基础上,本专利技术通过建立基于批量数据统一挂接操作,克服了原有的数据录入过程中数据匹配效率低,数据关联精度差的问题,在批量遍历的方法进行地籍信息挂接的同时,建立了基于基于最大后验概率分布计算地籍信息校验方式,通过自动校验关联概率的方式,提高地籍信息数据关联的准确性,避免人工操作过程中匹配效率过低的问题。
附图说明
[0026]图1为一种不动产存量数据整理方法流程图。
具体实施方式
[0027]实施例1:
[0028]本实施例所述的一种不动产存量数据整理方法及其应用,如图1所示,具体整理方
法流程为:
[0029]S1、对历史数据库中的不动产存量数据进行存量数据预处理;
[0030]S2、对预处理后的存量数据进行基于属性特征数据的拆分;
[0031]S3、对拆分后存量数据的属性特征进行多维度挂接处理,并生成标准化结构数据;
[0032]所述的图幅特征提取处理的具体操作流程为:
[0033]A1、首先需要将存量数据中图幅数据进行关键词结构拆分,消除原有的结构框架,并将格式统一转换为xml格式;
[0034]A2、之后在此基础上进行基于关键词属性拆分,进行基于“图号”“幅号”和“地号”但三部分字符属性,字符类型的筛选与提取;
[0035]A3、最后照指定的字符属性进行基于数据列表的字符重排布,实现图幅特征提取处理与结构化构建,并将其中构建失败的图幅特征筛选后进行人工校对筛选。
[0036]所述的基于批量数据统一挂接操作,其具体操作流程为:
[0037]B1、首先进行单一区域范围的划分;
[0038]B2、针对指定区域范围内的地籍信息建立第一数据列表,在数据列表中记录地籍信息的属性特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种不动产地籍数据存量数据整理方法,其特征在于,具体整理方法流程为:S1、对历史数据库中的不动产存量数据进行存量数据预处理;S2、对预处理后的存量数据进行基于属性特征数据的拆分;S3、对拆分后存量数据的属性特征进行多维度挂接处理,并生成标准化结构数据;S4、批量筛选标准化结构数据中的异常值与缺失值,同时实时与采集的现有数据进行比对,筛选出重复与部分重复的存量数据。2.根据权利要求1所述的一种不动产存量数据整理方法,其特征在于,所述的存量数据预处理,包括离散数据格式统一处理,地址结构化处理,图幅特征提取处理,地籍信息录入处理,图幅位置坐标标定处理。3.根据权利要求2所述的一种不动产存量数据整理方法,其特征在于,所述的地址结构化处理,建立了结构化格式列表。4.根据权利要求3所述的一种不动产存量数据整理方法,其特征在于,所述的结构化格式列表,将地址数据转换为字符串形式,并将字符串形式的数据拆分为数据编号,数据名称,数据类型,以此作为属性数据对地址数据进行分类组合处理,生成统一结构数据。5.根据权利要求2所述的一种不动产存量数据整理方法,其特...

【专利技术属性】
技术研发人员:袁国辉
申请(专利权)人:广州市房地产测绘院广州市测绘产品质量检验中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1