关于不动产登记数据的多源数据表管理方法技术

技术编号:37991446 阅读:26 留言:0更新日期:2023-06-30 10:05
本发明专利技术提出了一种关于不动产登记数据的多源数据表管理方法,包括如下步骤:S1,获取不同IP地址的多源数据表,将多源数据表进行标准化处理,对于限定的文件名文字进行去重处理;S2,对去重处理的标准化多源数据表进行表格内容映射过程,并根据设置的融合模型进行批量相似度去重;S3,根据设置的权重对多源数据表中的相似数据进行融合后,通过字符匹配度进行校验,并对融合后的多源数据表存储至数据库。并对融合后的多源数据表存储至数据库。并对融合后的多源数据表存储至数据库。

【技术实现步骤摘要】
关于不动产登记数据的多源数据表管理方法


[0001]本专利技术涉及数据分析领域,尤其涉及一种关于不动产登记数据的多源数据表管理方法。

技术介绍

[0002]不动产登记数据中的获取的数据源种类多、总量大,且各种数据的统计口径、范围不尽一致,在实际工作中,需要同时使用多个原始数据表,按要求分类展示,数据分类多,且每个分类下属的字段也多,不便于在同一个表中展示。所展示的内容不成体系,不方便查找、保持和展示,这就亟需本领域技术人员解决相应的技术问题。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种关于不动产登记数据的多源数据表管理方法。
[0004]为了实现本专利技术的上述目的,本专利技术提供了一种关于不动产登记数据的多源数据表管理方法,包括如下步骤:
[0005]S1,获取不同IP地址的多源数据表,将多源数据表进行标准化处理,对于限定的文件名文字进行去重处理;
[0006]S2,对去重处理的标准化多源数据表进行表格内容映射过程,并根据设置的融合模型进行批量相似度去本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种关于不动产登记数据的多源数据表管理方法,其特征在于,包括如下步骤:S1,获取不同IP地址的多源数据表,将多源数据表进行标准化处理,对于限定的文件名文字进行去重处理;S2,对去重处理的标准化多源数据表进行表格内容映射过程,并根据设置的融合模型进行批量相似度去重;S3,根据设置的权重对多源数据表中的相似数据进行融合后,通过字符匹配度进行校验,并对融合后的多源数据表存储至数据库。2.根据权利要求1所述的关于不动产登记数据的多源数据表管理方法,其特征在于,所述S1包括:S1

1,从不同IP地址获取Excel数据表,对多个Excel数据表格的快速联表处理,根据标准化处理方式形成集成数据表;所述标准化处理方式包括:S1

2,获取原始数据表,设置第一关键词,设置第二关键词;设置第三关键词,通过第一关键词、第二关键词和第三关键词遍历每一张原始数据表,根据第一关键词遍历之后的全部原始数据表,具有第一关键词属性的原始数据表进行合并处理,不具有第一关键词属性的原始数据表保存在备选数据库。3.根据权利要求1所述的关于不动产登记数据的多源数据表管理方法,其特征在于,所述S1包括:S1

3,根据合并之后的原始数据表形成第一合并数据表,根据第二关键词遍历之后的第一合并数据表,去除第一关键词字段内容,将具有第二关键词属性的第一合并数据表进行字段判断处理,将相同关键词的字段在数据表中集中展示,形成第二合并数据表,S1

4,根据第二关键词形成的第二合并数据表所归类展示的内容,对第三关键词形成的字段进行归类,选择第二关键词所归类展示的内容,根据第三关键词的时间轴顺序进行排序,形成第三合并数据表;S1

5,经过第一关键词、第二关键词和第三关键词遍历之后的第三合并数据表进行重新命名文件名,命名包含第二关键词以及相应的属性信息,从而第三合并数据表进行数据去重处理。4.根据权利要求1所述的关于不动产登记数据的多源数据表管理方法,其特征在于,所述S2包括:S2

1,去重处理过程中,从所述第三合并数据表对应的关联数据中获取所述重复字段以及重复数值对应的任一合并数据表作为去重数据表,所述去重数据表对应的任一关联数据在所述...

【专利技术属性】
技术研发人员:王雪陈柯吟汪蓓赵根陈坤蒋正坤闫亮朱丹曾航倪又隆
申请(专利权)人:重庆市规划和自然资源信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1