【技术实现步骤摘要】
一种房屋数据的处理方法、装置、设备及介质
[0001]本说明书涉及计算机
,尤其涉及一种房屋数据的处理方法、装置、设备及介质。
技术介绍
[0002]在社区数据治理过程中,通常需要对各类人员房屋数据进行预处理及分析,以便后期数据统计及分析的工作和社区事务的统一执行。在此过程中,一般通过sql语句对数据库中的数据进行查询和处理,但面对庞大的数据量和结构复杂的数据表,经常会出现查询和处理效率过慢的问题。
[0003]现需要一种房屋数据的处理方式,可以更好的将房屋信息与人员信息进行统计,方便后续进行查询和处理。
技术实现思路
[0004]本说明书一个或多个实施例提供了一种房屋数据的处理方法、装置、设备及介质,用于解决
技术介绍
提出的技术问题。
[0005]本说明书一个或多个实施例采用下述技术方案:
[0006]本说明书一个或多个实施例提供的一种房屋数据的处理方法,包括:
[0007]获取预先登记的人口信息表,所述人口信息表包括居住用户的身份信息与房屋信息;
[0008]在 ...
【技术保护点】
【技术特征摘要】
1.一种房屋数据的处理方法,其特征在于,所述方法包括:获取预先登记的人口信息表,所述人口信息表包括居住用户的身份信息与房屋信息;在所述人口信息表中提取出所述居住用户的房屋信息,并根据所述居住用户的房屋信息建立房屋信息表;将所述房屋信息表与所述人口信息表进行关联,形成人口房屋信息表。2.根据权利要求1所述的方法,其特征在于,所述将所述房屋信息表与所述人口信息表进行关联,具体包括:根据预先设定的规则,在所述房屋信息表中生成所述居住用户的房屋信息对应的房屋标识;将所述房屋标识与所述人口信息表中的房屋信息进行匹配,并将所述房屋标识添加至所述人口信息表。3.根据权利要求1所述的方法,其特征在于,所述获取预先登记的人口信息表,具体包括:通过数据处理引擎spark获取预先登记的人口信息表;通过所述spark的相应分割算子对所述人口信息表中的字段进行分割;通过所述spark的相应清洗算子对分割后的字段进行数据清洗。4.根据权利要求3所述的方法,其特征在于,所述通过所述spark的相应清洗算子对分割后的字段进行数据清洗,具体包括:通过所述spark的filter算子对分割后的字段进行缺失值处理,以过滤所述人口信息表中居住用户的身份信息缺失的字段;通过所述spark的distinct算子对分割后的字段进行重复值处理,以筛选所述人口信息表中居住用户的身份信息重复的字段。5.根据权利要求3所述的方法,其特征在于,所述将所述房屋信息表与所述人口信息表进行关联,具体包括:通过所述spark的groupBy算子将所述房屋信息表与所述人口信息表进行关联。6.根据权利要求1所述的方法,其特征在于,所述获取预先登记的人口信息表后,所述方法还包括:获取预先设定的流动人口筛选规则;根据所述流动人口筛选规则,在所述人口信息表中筛选出登记居...
【专利技术属性】
技术研发人员:杨璞,申传旺,赵海兴,孙永超,
申请(专利权)人:浪潮卓数大数据产业发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。