区域流动人口识别方法、装置、设备及介质制造方法及图纸

技术编号：28222978 阅读：18 留言：0更新日期：2021-04-28 09:50

本申请实施例提供一种区域流动人口识别方法、装置、设备及介质。该方法包括：获取多个用户的位置轨迹数据；将多个位置轨迹数据输入到第一区域流动人口识别模型中，输出多个用户标签，其中，用户标签与位置轨迹数据一一对应；根据多个用户标签，确定多个用户中为区域流动人口的目用户。根据本申请实施例，可以对区域内人口属性有更细致和精确的划分，进而更加准确地识别区域流动人口。确地识别区域流动人口。确地识别区域流动人口。

全部详细技术资料下载

【技术实现步骤摘要】
区域流动人口识别方法、装置、设备及介质

[0001]本申请涉及大数据分析
，尤其涉及区域流动人口识别方法、装置、设备及介质。

技术介绍

[0002]目前，工作、搬家、旅游等原因导致人们区域内频繁流动性强，因而在城市或区县级别的人口统计和旅游统计等大数据实施项目中需要准确地剔除该区域的流动人口，所以流动人口的准确识别是至关重要的。
[0003]然而，现在有三种关于区域流动人口识别的方法：第一种方法是凭经验和常识设定停留时间阈值，当用户在区域内逗留时间低于设定的停留时间阈值时，即该用户为流动人口。第二种方法是基于通过互联网问卷调查、电话访问等方式采集的样本数据进行分析建模找出流动人口的共性特征，符合共性特征的人口即为流动人口。第三种方法是利用最能体现人口特征的电信行为识别流动人口。
[0004]上述三种关于区域流动人口识别的方法都存在没有科学依据、计算量巨大、优化精度不足的问题。因此，如何准确简便地识别区域流动人口是一个亟待解决的问题。

技术实现思路

[0005]本申请实施例提供一种区域流动人口识别方法、装置、设备及介质，能够对区域内人口属性有更细致和精确的划分，进而可以更加准确地识别区域内的流动人口。
[0006]第一方面，本申请实施例提供一种区域流动人口识别方法，方法包括：获取多个用户的位置轨迹数据；将多个位置轨迹数据输入到第一区域流动人口识别模型中，输出多个用户标签，其中，用户标签与位置轨迹数据一一对应；根据多个用户标签，确定多个用户中为区域流动人口的目标用户。
>[0007]在第一方面的一些实施例中，获取多个用户的位置轨迹数据，包括：获取预设地区的各个区域的基站信息、预设统计周期内用户在预设地区的各个区域的用户打卡记录；根据用户打卡记录确定多个用户；根据基站信息和用户打卡记录确定多个用户对应的位置轨迹数据。
[0008]在第一方面的一些实施例中，在将多个位置轨迹数据输入到第一区域流动人口识别模型中，输出多个用户标签之前，包括：获取指标字段数据；将指标字段数据进行标准化处理，得到新指标字段数据；根据新指标字段数据利用聚类算法将位置轨迹数据进行聚类，得到多个聚类结果；计算多个聚类结果的相似度；根据相似度对多个聚类结果进行评估，得到最佳聚类结果；将最佳聚类结果输入到预先训练的区域流动人口识别模型，得到第一训练区域流动识别人口模型。
[0009]在第一方面的一些实施例中，指标字段数据包括：区域内最长基站打点时间、区域内基站打点总时长、区域内基站最早打点时间、区域内最晚基站打点时间、区域内基站打点个数、区域内打点总距离和区域内最早打点基站与最晚打点基站间距离。
[0010]在第一方面的一些实施例中，在根据多个用户标签，确定多个用户中为区域流动人口的目标用户之后，包括：确定目标用户的行为特征；根据目标用户的行为特征利用标准差法确定用户是否为区域流动人口。
[0011]在第一方面的一些实施例中，在获取多个用户的位置轨迹数据之前，方法还包括：获取多个训练样本，其中，训练样本包括用户的位置轨迹数据；针对每个训练样本分别执行以下步骤：将训练样本输入到待训练的区域人口识别模型，得到识别结果；判断是否满足预设的训练停止条件；在不满足预设的训练停止条件的情况下，利用识别结果和训练样本的标签数据，调整区域流动人口识别模型的模型参数，将多个新的训练样本输入到调整后的区域流动人口识别模型，直至满足预设的训练停止条件，得到训练后的区域流动人口识别模型，其中，训练样本的标签数据包括训练样本是否为区域流动人口的判断结果。
[0012]第二方面，本申请实施例提供了一种区域流动人口识别装置，装置包括：获取模块，用于获取多个用户的位置轨迹数据；处理模块，用于将多个位置轨迹数据输入到第一区域流动人口识别模型中，输出多个用户标签，其中，用户标签与位置轨迹数据一一对应；确定模块，用于根据多个用户标签，确定多个用户中为区域流动人口的目标用户。
[0013]在第二方面的一些实施例中，获取模块具体用于：获取预设地区的各个区域的基站信息、预设统计周期内用户在预设地区的各个区域的用户打卡记录；根据用户打卡记录确定多个用户；根据基站信息和用户打卡记录确定多个用户对应的位置轨迹数据。
[0014]第三方面，提供一种区域流动人口识别设备，包括：存储器，用于存储计算机程序指令；
[0015]处理器，用于读取并运行存储器中存储的计算机程序指令，以执行第一方面或第一方面的任一可选的实施方式提供的区域流动人口识别方法。
[0016]第四方面，提供一种计算机存储介质，计算机存储介质上存储有计算机程序指令，计算机程序指令被处理器执行时实现第一方面或第一方面的任一可选的实施方式提供的区域流动人口识别方法。
[0017]本申请实施例的区域流动人口识别方法、装置、设备及介质，通过获取多个用户的位置轨迹数据，然后将多个位置轨迹数据输入到第一区域流动人口识别模型中，输出多个位置轨迹数据中每一个位置轨迹数据对应的用户标签，最后根据多个用户标签，确定多个用户中为区域流动人口的目标用户。根据本申请实施例，可以对区域内人口属性有更细致和精确的划分，进而更加准确地识别区域流动人口。
附图说明
[0018]为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单的介绍，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0019]图1是本申请实施例提供的一种区域流动人口识别方法的流程示意图；
[0020]图2是本申请实施例提供的另一种区域流动人口识别方法的流程示意图；
[0021]图3是本申请实施例提供的一种聚类结果为7类的组内均值分布雷达图；
[0022]图4是本申请实施例提供的一种聚类结果为5类的组内均值分布雷达图；
[0023]图5是本申请实施例提供的一种评估聚类效果的可视化示意图；
[0024]图6是本申请实施例提供的又一种区域流动人口识别方法的流程示意图；
[0025]图7是本申请实施例提供的一种区域流动人口识别装置的结构示意图；
[0026]图8是本申请实施例提供的一种区域流动人口识别设备的结构示意图。
具体实施方式
[0027]下面将详细描述本申请的各个方面的特征和示例性实施例，为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及具体实施例，对本申请进行进一步详细描述。应理解，此处所描述的具体实施例仅意在解释本申请，而不是限定本申请。对于本领域技术人员来说，本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
[0028]需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种区域流动人口识别方法，其特征在于，包括：获取多个用户的位置轨迹数据；将所述多个位置轨迹数据输入到第一区域流动人口识别模型中，输出多个用户标签，其中，所述用户标签与所述位置轨迹数据一一对应；根据所述多个用户标签，确定所述多个用户中为区域流动人口的目标用户。2.根据权利要求1所述的方法，其特征在于，所述获取多个用户的位置轨迹数据，包括：获取预设地区的各个区域的基站信息、预设统计周期内用户在预设地区的各个区域的用户打卡记录；根据所述用户打卡记录确定多个用户；根据所述基站信息和所述用户打卡记录确定所述多个用户对应的位置轨迹数据。3.根据权利要求1所述的方法，其特征在于，在所述将所述多个位置轨迹数据输入到第一区域流动人口识别模型中，输出多个用户标签之前，包括：获取指标字段数据；将所述指标字段数据进行标准化处理，得到新指标字段数据；根据所述新指标字段数据利用聚类算法将所述位置轨迹数据进行聚类，得到多个聚类结果；计算所述多个聚类结果的相似度；根据相似度对所述多个聚类结果进行评估，得到最佳聚类结果；将所述最佳聚类结果输入到预先训练的区域流动人口识别模型，得到第一训练区域流动人口识别模型。4.根据权利要求3所述的方法，其特征在于，所述指标字段数据包括：区域内最长基站打点时间、区域内基站打点总时长、区域内基站最早打点时间、区域内最晚基站打点时间、区域内基站打点个数、区域内打点总距离和区域内最早打点基站与最晚打点基站间距离。5.根据权利要求1所述的方法，其特征在于，在所述根据所述多个用户标签，确定所述多个用户中为区域流动人口的目标用户之后，包括：确定目标用户的行为特征；根据所述目标用户的行为特征利用标准差法确定用户是否为区域流动人口。6.根据权利要求1所述的方法，其特征在于，在所述获取多个用户的位置轨迹数据之前...

【专利技术属性】
技术研发人员：谷建泽，赵雨，樊巧云，陆天珺，方海贝，孙苑苑，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人