本说明书实施例公开了一种房屋数据的处理方法、装置、设备及介质,包括:获取预先登记的人口信息表,所述人口信息表包括居住用户的身份信息与房屋信息;在所述人口信息表中提取出所述居住用户的房屋信息,并根据所述居住用户的房屋信息建立房屋信息表;将所述房屋信息表与所述人口信息表进行关联,形成人口房屋信息表。本说明实施例通过人房数据分表治理的方式,可以将两个表分别针对到相应的具体业务,大大减少数据的查询次数。大大减少数据的查询次数。大大减少数据的查询次数。
【技术实现步骤摘要】
一种房屋数据的处理方法、装置、设备及介质
[0001]本说明书涉及计算机
,尤其涉及一种房屋数据的处理方法、装置、设备及介质。
技术介绍
[0002]在社区数据治理过程中,通常需要对各类人员房屋数据进行预处理及分析,以便后期数据统计及分析的工作和社区事务的统一执行。在此过程中,一般通过sql语句对数据库中的数据进行查询和处理,但面对庞大的数据量和结构复杂的数据表,经常会出现查询和处理效率过慢的问题。
[0003]现需要一种房屋数据的处理方式,可以更好的将房屋信息与人员信息进行统计,方便后续进行查询和处理。
技术实现思路
[0004]本说明书一个或多个实施例提供了一种房屋数据的处理方法、装置、设备及介质,用于解决
技术介绍
提出的技术问题。
[0005]本说明书一个或多个实施例采用下述技术方案:
[0006]本说明书一个或多个实施例提供的一种房屋数据的处理方法,包括:
[0007]获取预先登记的人口信息表,所述人口信息表包括居住用户的身份信息与房屋信息;
[0008]在所述人口信息表中提取出所述居住用户的房屋信息,并根据所述居住用户的房屋信息建立房屋信息表;
[0009]将所述房屋信息表与所述人口信息表进行关联,形成人口房屋信息表。
[0010]可选的,所述将所述房屋信息表与所述人口信息表进行关联,具体包括:
[0011]根据预先设定的规则,在所述房屋信息表中生成所述居住用户的房屋信息对应的房屋标识;
[0012]将所述房屋标识与所述人口信息表中的房屋信息进行匹配,并将所述房屋标识添加至所述人口信息表。
[0013]可选的,所述获取预先登记的人口信息表,具体包括:
[0014]通过数据处理引擎spark获取预先登记的人口信息表;
[0015]通过所述spark的相应分割算子对所述人口信息表中的字段进行分割;
[0016]通过所述spark的相应清洗算子对分割后的字段进行数据清洗。
[0017]可选的,所述通过所述spark的相应清洗算子对分割后的字段进行数据清洗,具体包括:
[0018]通过所述spark的filter算子对分割后的字段进行缺失值处理,以过滤所述人口信息表中居住用户的身份信息缺失的字段;
[0019]通过所述spark的distinct算子对分割后的字段进行重复值处理,以筛选所述人
口信息表中居住用户的身份信息重复的字段。
[0020]可选的,所述将所述房屋信息表与所述人口信息表进行关联,具体包括:
[0021]通过所述spark的groupBy算子将所述房屋信息表与所述人口信息表进行关联。
[0022]可选的,所述获取预先登记的人口信息表后,所述方法还包括:
[0023]获取预先设定的流动人口筛选规则;
[0024]根据所述流动人口筛选规则,在所述人口信息表中筛选出登记居住时间范围的字段;
[0025]所述根据所述居住用户的房屋信息建立房屋信息表后,所述方法还包括:
[0026]将所述居住时间范围的字段对应居住时间标记在所述房屋信息表的对应位置。
[0027]可选的,在查询指定时间的第一房屋信息时,所述方法还包括:
[0028]在确定所述第一房屋的第一居住用户标记第一居住时间时,判断所述指定时间是否处于第一居住时间;
[0029]若否,将所述第一居住用户设定为非所述第一房屋的居住用户。
[0030]本说明书一个或多个实施例提供的一种房屋数据的处理装置,所述装置包括:
[0031]人口信息表获取单元,获取预先登记的人口信息表,所述人口信息表包括居住用户的身份信息与房屋信息;
[0032]房屋信息表建立单元,在所述人口信息表中提取出所述居住用户的房屋信息,并根据所述居住用户的房屋信息建立房屋信息表;
[0033]关联单元,将所述房屋信息表与所述人口信息表进行关联,形成人口房屋信息表。
[0034]本说明书一个或多个实施例提供的一种房屋数据的处理设备,包括:
[0035]至少一个处理器;以及,
[0036]与所述至少一个处理器通信连接的存储器;其中,
[0037]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
[0038]获取预先登记的人口信息表,所述人口信息表包括居住用户的身份信息与房屋信息;
[0039]在所述人口信息表中提取出所述居住用户的房屋信息,并根据所述居住用户的房屋信息建立房屋信息表;
[0040]将所述房屋信息表与所述人口信息表进行关联,形成人口房屋信息表。
[0041]本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
[0042]获取预先登记的人口信息表,所述人口信息表包括居住用户的身份信息与房屋信息;
[0043]在所述人口信息表中提取出所述居住用户的房屋信息,并根据所述居住用户的房屋信息建立房屋信息表;
[0044]将所述房屋信息表与所述人口信息表进行关联,形成人口房屋信息表。
[0045]本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
[0046]本说明实施例通过人房数据分表治理的方式,可以将两个表分别针对到相应的具体业务,大大减少数据的查询次数。
附图说明
[0047]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0048]图1为本说明书一个或多个实施例提供的一种房屋数据的处理方法的流程示意图;
[0049]图2为本说明书一个或多个实施例提供的一种房屋数据的处理装置的结构示意图;
[0050]图3为本说明书一个或多个实施例提供的一种房屋数据的处理设备的结构示意图。
具体实施方式
[0051]本说明书实施例提供一种房屋数据的处理方法、装置、设备及介质。
[0052]在互联网的高速发展下,国家也推动了一系列政策来加强“智慧城市”,“智慧社区”建设。在“智慧社区”的政府信息系统开发过程中,往往需要通过人与房屋地址之间的关系,统计分析各层级地址内的年龄分布、性别分布、收支分布、学历分布等。同时还需要支撑各类数据的查询及检索业务。
[0053]在社区数据治理过程中,通常需要对各类人员房屋数据进行预处理及分析,以便后期数据统计及分析的工作和社区事务的统一执行。在此过程中,一般通过sql语句对数据库中的数据进行查询和处理,但面对庞大的数据量和结构复杂的数据表,经常会出现查询和处理效率过慢的问题。
[0054]为了本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种房屋数据的处理方法,其特征在于,所述方法包括:获取预先登记的人口信息表,所述人口信息表包括居住用户的身份信息与房屋信息;在所述人口信息表中提取出所述居住用户的房屋信息,并根据所述居住用户的房屋信息建立房屋信息表;将所述房屋信息表与所述人口信息表进行关联,形成人口房屋信息表。2.根据权利要求1所述的方法,其特征在于,所述将所述房屋信息表与所述人口信息表进行关联,具体包括:根据预先设定的规则,在所述房屋信息表中生成所述居住用户的房屋信息对应的房屋标识;将所述房屋标识与所述人口信息表中的房屋信息进行匹配,并将所述房屋标识添加至所述人口信息表。3.根据权利要求1所述的方法,其特征在于,所述获取预先登记的人口信息表,具体包括:通过数据处理引擎spark获取预先登记的人口信息表;通过所述spark的相应分割算子对所述人口信息表中的字段进行分割;通过所述spark的相应清洗算子对分割后的字段进行数据清洗。4.根据权利要求3所述的方法,其特征在于,所述通过所述spark的相应清洗算子对分割后的字段进行数据清洗,具体包括:通过所述spark的filter算子对分割后的字段进行缺失值处理,以过滤所述人口信息表中居住用户的身份信息缺失的字段;通过所述spark的distinct算子对分割后的字段进行重复值处理,以筛选所述人口信息表中居住用户的身份信息重复的字段。5.根据权利要求3所述的方法,其特征在于,所述将所述房屋信息表与所述人口信息表进行关联,具体包括:通过所述spark的groupBy算子将所述房屋信息表与所述人口信息表进行关联。6.根据权利要求1所述的方法,其特征在于,所述获取预先登记的人口信息表后,所述方法还包括:获取预先设定的流动人口筛选规则;根据所述流动人口筛选规则,在所述人口信息表中筛选出登记居...
【专利技术属性】
技术研发人员:杨璞,申传旺,赵海兴,孙永超,
申请(专利权)人:浪潮卓数大数据产业发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。