一种基于大数据的人口结构分析方法、系统及可读存储介质技术方案

技术编号:31928360 阅读:27 留言:0更新日期:2022-01-15 13:16
本申请实施例提出一种基于大数据的人口结构分析方法、系统和存储介质,该方法包括获取所属目标区域的用户移动数据,并根据用户移动数据确定目标区域中各用户在历史预设时段内的移动区域信息;移动区域信息包括用户在相应时间点所到达的移动区域、按照时间顺序确定的移动区域前、后重复出现的间隔时间点、用户在移动区域中的驻留时间点;根据移动区域重复出现的重合程度、以及不同用户在相同移动区域中的驻留关联程度,对各项移动区域信息进行聚合分析,以确定各用户的历史移动规律;根据历史移动规律,从目标区域的各用户中识别出常住用户;确定常住用户的身份属性信息,根据身份属性信息进行人口结构划分,以确定目标区域的人口结构分布信息。人口结构分布信息。人口结构分布信息。

【技术实现步骤摘要】
一种基于大数据的人口结构分析方法、系统及可读存储介质


[0001]本申请涉及数据分析
,具体而言,涉及一种基于大数据的人口结构分析方法、系统及可读存储介质。

技术介绍

[0002]人口结构一般指人口构成。人口构成,是指把人口总体区分为各个组成部分。当前随着社会的变更发展,根据人口的不同特征,可划分得到三大类人口构成包括人口的自然构成、地域构成与社会构成。其中,自然构成是依人口的生理属性划分得到,主要有性别构成与年龄构成。地域构成指人口的地理分布状况,包括人口的行政、自然与经济区域分布、城乡分布等。社会构成是依人口的社会经济属性来划分的,包括人口的婚姻状况构成、家庭类型构成、文化教育程度构成等。目前,已有相关的研究人员,基于宏观统计学分析汇总方式,结合人口构成因素的特点和作用的分类方式,将人口结构划分为三大类:1.人口自然构成;2.人口地域构成;3.人口社会构成。然而,这种统计方式一般以人工统计为主导核心,涉及到的统计工作量大,存在统计信息误差大的问题。

技术实现思路

[0003]本申请实施例的目的在基于提供一种基于大数据的人口结构分析方法、系统及可读存储介质,可以降低统计信息误差率。
[0004]本申请实施例还提供了一种基于大数据的人口结构分析方法,包括以下步骤:获取所属目标区域的用户移动数据,并根据所述用户移动数据确定目标区域中各用户在历史预设时段内的移动区域信息;所述移动区域信息包括用户在相应时间点所到达的移动区域、按照时间顺序确定的移动区域前、后重复出现的间隔时间点、用户在移动区域中的驻留时间点;根据移动区域重复出现的重合程度、以及不同用户在相同移动区域中的驻留关联程度,对所确定的各项移动区域信息进行聚合分析,以确定各用户分别在历史预设时段内的历史移动规律;根据所述历史移动规律,从目标区域的各用户中识别出常住用户;确定常住用户的身份属性信息,并根据所述身份属性信息进行人口结构划分,以确定目标区域的人口结构分布信息。
[0005]第二方面,本申请实施例还提供了一种基于大数据的人口结构分析系统,所述系统包括数据获取模块、移动规律分析模块、常住用户识别模块和人口结构划分模块,其中:所述数据获取模块,用于获取所属目标区域的用户移动数据,并根据所述用户移动数据确定目标区域中各用户在历史预设时段内的移动区域信息;所述移动区域信息包括用户在相应时间点所到达的移动区域、按照时间顺序确定的移动区域前、后重复出现的间隔时间点、用户在移动区域中的驻留时间点;所述移动规律分析模块,用于根据移动区域重复出现的重合程度、以及不同用户
在相同移动区域中的驻留关联程度,对所确定的各项移动区域信息进行聚合分析,以确定各用户分别在历史预设时段内的历史移动规律;所述常住用户识别模块,用于根据所述历史移动规律,从目标区域的各用户中识别出常住用户;所述人口结构划分模块,用于确定常住用户的身份属性信息,并根据所述身份属性信息进行人口结构划分,以确定目标区域的人口结构分布信息。
[0006]第三方面,本申请实施例还提供了一种可读存储介质,所述可读存储介质中包括基于大数据的人口结构分析方法程序,所述基于大数据的人口结构分析方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的人口结构分析方法的步骤。
[0007]由上可知,本申请实施例提供的一种基于大数据的人口结构分析方法、系统及可读存储介质,根据移动区域重复出现的重合程度、以及不同用户在相同移动区域中的驻留关联程度,对各项移动区域信息进行聚合分析,可以有效挖掘出数据间关联性,更好的分析出用户的移动规律。结合分析出的历史移动规律,从目标区域的各用户中识别出常住用户,实现对流动用户的剔除,保证了人口结构划分结果的正确性,降低了统计信息的误差率。
[0008]本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0009]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0010]图1为本申请实施例提供的基于大数据的人口结构分析方法的一种流程图。
[0011]图2为本申请实施例提供的基于大数据的人口结构分析系统的一种结构示意图。
具体实施方式
[0012]下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0013]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0014]请参照图1,图1是本申请一些实施例中的一种基于大数据的人口结构分析方法的流程图。以该方法应用于计算机设备(该计算机设备具体可以是终端或服务器,终端具体可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服
务器可以用独立的服务器或者是多个服务器组成的服务器集群)为例进行说明,包括以下步骤:步骤S1,获取所属目标区域的用户移动数据,并根据用户移动数据确定目标区域中各用户在历史预设时段内的移动区域信息;移动区域信息包括用户在相应时间点所到达的移动区域、按照时间顺序确定的移动区域前、后重复出现的间隔时间点、用户在移动区域中的驻留时间点。
[0015]具体的,计算机设备可以基于运营商提供的手机信令数据确定所属目标区域的用户移动数据。需要说明是,一般通过手机用户之间的通话频率和通话时长,来确定用户的手机通话数据,以此反映用户之间的信息联系强度;一般也可通过手机用户在基站之间的信息交换,来确定用户的空间位置,该空间位置能相对准确的记录人流的时空轨迹。而,只要在发生开关机、通话、短信、位置更新和切换基站行为的情况下,都会记录下相应的信令数据;该信令数据将反馈到计算机设备,由计算机设备基于手机信令数据,确定目标区域中各用户的移动区域。当前实施例中,基于手机信令数据的动态实时性和连续性,即时不同时间点手机用户所在的空间位置,为描述目标区域内的人群流动、以及用户之间的联系强度提供遍历。
[0016]在其中一个实施例中,在计算机设备无法及时获取到手机本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的人口结构分析方法,其特征在于,包括以下步骤:获取所属目标区域的用户移动数据,并根据所述用户移动数据确定目标区域中各用户在历史预设时段内的移动区域信息;所述移动区域信息包括用户在相应时间点所到达的移动区域、按照时间顺序确定的移动区域前、后重复出现的间隔时间点、用户在移动区域中的驻留时间点;根据移动区域重复出现的重合程度、以及不同用户在相同移动区域中的驻留关联程度,对所确定的各项移动区域信息进行聚合分析,以确定各用户分别在历史预设时段内的历史移动规律;根据所述历史移动规律,从目标区域的各用户中识别出常住用户;确定常住用户的身份属性信息,并根据所述身份属性信息进行人口结构划分,以确定目标区域的人口结构分布信息。2.根据权利要求1所述的方法,其特征在于,所述用户移动数据基于运营商提供的手机信令数据确定;所述手机信令数据包括用户标识、用于记录人流的时空轨迹的空间位置标识;所述根据所述用户移动数据确定目标区域中各用户在历史预设时段内的移动区域信息,包括:获取目标区域中各用户分别对应的目标用户标识,并根据所述目标用户标识进行目标空间位置标识的确定;按照时间顺序、以及邻近区域在时空上的关联顺序,对所述目标空间位置标识进行排序,并根据排序结果,确定各用户在历史预设时段内的移动区域信息。3.根据权利要求1所述的方法,其特征在于,所述根据移动区域重复出现的重合程度、以及不同用户在相同移动区域中的驻留关联程度,对所确定的各项移动区域信息进行聚合分析,包括:基于区域重合程度,对所确定的各个移动区域进行一次聚合,基于得到的一次聚合结果,确定各移动区域的重复出现次数;针对重复出现次数小于预设最低次数阈值的第一移动区域、以及所述第一移动区域关联到的第一目标用户,生成表征第一目标用户不常在所述第一移动区域中活动的第一历史移动规律;针对重复出现次数大于或等于预设最低次数阈值的第二移动区域、以及所述第二移动区域关联到的第二目标用户,基于在进、出区域时间点、以及驻留时长上的驻留关联程度,进行二次聚合;基于得到的二次聚合结果,从第二目标用户群体中筛选出存在驻留关联的第三目标用户,并生成表征第三目标用户常在所述第二移动区域中活动的第二历史移动规律。4.根据权利要求1所述的方法,其特征在于,所述根据所述历史移动规律,从目标区域的各用户中识别出常住用户,包括:获取用户的身份属性信息,所述身份属性信息包括年龄信息、职业信息、户籍信息、以及籍贯信息中的至少一种;根据所述历史移动规律、以及所述身份属性信息,对用户在未来预设时段内的移动规律进行预测,得到对应的未来移动规律;
综合所述历史移动规律和所述未来移动规律,基于用户在目标区域中的移动频率,从目标区域的各用户中识别出常住用户。5.根据权利要求1所述的方法,其特征在于,所述根据所述身份属性信息进行人口结构划分,以确定目标区域的人口结构分布信息,包括:确定各常住用户的身份属性信息分别所属的...

【专利技术属性】
技术研发人员:成立立孙伟利张广志陈桂红于笑博
申请(专利权)人:北京融信数联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1