一种职住地分布的解析方法、解析装置及可读存储介质制造方法及图纸

技术编号:23050120 阅读:22 留言:0更新日期:2020-01-07 14:46
本申请提供了一种职住地分布的解析方法、解析装置及可读存储介质,通过从各平台数据库中获取在预设时间段内待解析区域的多个访问数据,识别出用户身份标识信息、访问位置信息和访问时间信息;以每个用户身份标识为依据,对访问位置信息和访问时间信息进行聚合处理,得到与表示同一用户的每个用户身份标识相对应的多个访问位置和多个访问时间;将每个访问位置对应的位置点匹配至对应的地理网格中;基于预设的工作时间段、休息时间段、匹配后的地理网格分布图以及与每个用户身份标识相对应的多个访问时间,确定待解析区域中各用户身份标识对应的用户的职住地。这样,可以保证分析数据的多样性和准确性,提高用户职住地解析结果的精确度。

An analytic method, analytical device and readable storage medium for the distribution of duty and residence

【技术实现步骤摘要】
一种职住地分布的解析方法、解析装置及可读存储介质
本申请涉及大数据处理
,尤其是涉及一种职住地分布的解析方法和解析装置,以及存储有可供电子设备读取存储指令的可读存储介质。
技术介绍
职住地是工作地点和居住地点的合称,通过分析职住地的分布,有助于为城市规划提供决策支持。而在营销领域中,还可根据用户的职住地分布设置门店,实现就近营销、精准营销,为营销者和用户带来便利。传统确定职住地分布的方法主要是服务器获取智能设备的通信信令数据,每个信令数据都会对应唯一的设备序列号,通过汇总同一个设备序列号的数据,实现对该设备的定位,从而确定用户的职住地分布。然而,在通过对通信信令得到的设备定位,会由于定位偏差或者定位漂移等,导致确定的职住地位置仍不精细,职住地分布结果容易存在偏差。
技术实现思路
有鉴于此,本申请的目的在于提供一种职住地分布的解析方法、解析装置及可读存储介质,通过多平台数据分析,可以准确得到职住地统计和分布,从而提高职住地解析结果的精确度和准确率,降低职住地分布结果中存在分布偏差的概率。本申请实施例提供了一种职住地分布的解析方法,所述解析方法包括:从各平台数据库中获取在预设时间段内待解析区域的多个访问数据;从所述多个访问数据中识别出用户身份标识信息、访问位置信息和访问时间信息;以所述用户身份标识信息指示的每个用户身份标识为依据,对所述访问位置信息和所述访问时间信息进行聚合处理,得到与表示同一用户的每个用户身份标识相对应的多个访问位置和多个访问时间;基于获取的地理网格分布图中各地理网格表示的地理区域以及每个用户对应的多个访问位置,将每个访问位置对应的位置点匹配至对应的地理网格中;基于预设的工作时间段、休息时间段、匹配后的地理网格分布图以及与每个用户身份标识相对应的多个访问时间,确定待解析区域中各用户身份标识对应的用户的职住地。进一步的,从所述多个访问数据中识别出用户身份标识信息、访问位置信息和访问时间信息包括:对所述多个访问数据进行格式归一化处理;从格式归一化处理后的访问数据中识别出用户身份标识信息、访问位置信息和访问时间信息。进一步的,对所述多个访问数据进行格式归一化处理包括:从所述多个访问数据中表示同类信息的数据按照预设的数据格式存储到待解析数据库中。进一步的,所述用户身份标识信息包括:计算机序列号和手持智能设备序列号;在对所述多个访问数据进行格式归一化处理之后,从格式归一化处理后的访问数据中识别出用户身份标识信息、访问位置信息和访问时间信息之前,所述解析方法还包括:从格式归一化处理后的访问数据中获取用户预留信息;识别出用户预留信息表示同一用户的计算机序列号和手持智能设备序列号,并将该计算机序列号和该手持智能设备序列号确定为表示同一用户的相同用户身份标识。进一步的,基于预设的工作时间段、休息时间段、匹配后的地理网格分布图以及与每个用户身份标识相对应的多个访问时间,确定待解析区域中各用户身份标识对应的用户的职住地,包括:获取预设的工作时间段和预设的休息时间段;针对每个用户身份标识,从与该用户身份标识相对应的多个访问时间中确定出位于所述工作时间段内的多个第一访问时间和位于所述休息时间段内的多个第二访问时间,以及从与该用户身份标识相对应的多个访问位置中确定出在每个第一访问时间时该用户身份标识的第一访问位置和在每个第二访问时间时该用户身份标识的第二访问位置;基于每个第一访问位置对应的位置点以及每个第二访问位置对应的位置点,分别从匹配后的地理网格分布图的各地理网格中确定第一目标地理网格和第二目标地理网格,并确定所述第一目标地理网格对应的实际地理区域为该用户身份标识的工作地,以及所述第二目标地理网格对应的实际地理区域为该用户身份标识的居住地;其中,所述第一目标地理网格中对应的第一访问位置的数量,大于匹配后的地理网格分布图中除所述第一目标地理网格之外的其他地理网格中对应的第一访问位置的数量,所述第二目标地理网格中对应的第二访问位置数量,大于匹配后的地理网格分布图中除所述第二目标地理网格之外的其他地理网格中对应的第二访问位置的数量。本申请实施例还提供了一种职住地分布的解析装置,所述装置包括:获取模块,用于从各平台数据库中获取在预设时间段内待解析区域的多个访问数据;识别模块,用于从所述多个访问数据中识别出用户身份标识信息、访问位置信息和访问时间信息;处理模块,用于以所述用户身份标识信息指示的每个用户身份标识为依据,对所述访问位置信息和所述访问时间信息进行聚合处理,得到与表示同一用户的每个用户身份标识相对应的多个访问位置和多个访问时间;匹配模块,用于基于获取的地理网格分布图中各地理网格表示的地理区域以及每个用户对应的多个访问位置,将每个访问位置对应的位置点匹配至对应的地理网格中;确定模块,用于基于预设的工作时间段、休息时间段、匹配后的地理网格分布图以及与每个用户身份标识相对应的多个访问时间,确定待解析区域中各用户身份标识对应的用户的职住地。进一步的,所述识别模块包括:归一化处理单元,用于对所述多个访问数据进行格式归一化处理;识别单元,用于从格式归一化处理后的访问数据中识别出用户身份标识信息、访问位置信息和访问时间信息。进一步的,所述归一化处理单元还用于,从所述多个访问数据中表示同类信息的数据按照预设的数据格式存储到待解析数据库中。进一步的,所述识别模块还包括:第一获取单元,用于从格式归一化处理后的访问数据中获取用户预留信息;第一确定单元,用于识别出用户预留信息表示同一用户的计算机序列号和手持智能设备序列号,并将该计算机序列号和该手持智能设备序列号确定为表示同一用户的相同用户身份标识。进一步的,所述确定模块包括:第二获取单元,用于获取预设的工作时间段和预设的休息时间段;第二确定单元,用于针对每个用户身份标识,从与该用户身份标识相对应的多个访问时间中确定出位于所述工作时间段内的多个第一访问时间和位于所述休息时间段内的多个第二访问时间,以及从与该用户身份标识相对应的多个访问位置中确定出在每个第一访问时间时该用户身份标识的第一访问位置和在每个第二访问时间时该用户身份标识的第二访问位置;第三确定单元,用于基于每个第一访问位置对应的位置点以及每个第二访问位置对应的位置点,分别从匹配后的地理网格分布图的各地理网格中确定第一目标地理网格和第二目标地理网格,并确定所述第一目标地理网格对应的实际地理区域为该用户身份标识的工作地,以及所述第二目标地理网格对应的实际地理区域为该用户身份标识的居住地;其中,所述第一目标地理网格中对应的第一访问位置的数量,大于匹配后的地理网格分布图中除所述第一目标地理网格之外的其他地理网格中对应的第一访问位置的数量,所述第二目标地理网格中对应的第二访问位置数量,大于匹配后的地理网格分布图中除所述第二目标地理网格之外的其他地理网格中对应的第二访问位本文档来自技高网...

【技术保护点】
1.一种职住地分布的解析方法,其特征在于,所述解析方法包括:/n从各平台数据库中获取在预设时间段内待解析区域的多个访问数据;/n从所述多个访问数据中识别出用户身份标识信息、访问位置信息和访问时间信息;/n以所述用户身份标识信息指示的每个用户身份标识为依据,对所述访问位置信息和所述访问时间信息进行聚合处理,得到与表示同一用户的每个用户身份标识相对应的多个访问位置和多个访问时间;/n基于获取的地理网格分布图中各地理网格表示的地理区域以及每个用户对应的多个访问位置,将每个访问位置对应的位置点匹配至对应的地理网格中;/n基于预设的工作时间段、休息时间段、匹配后的地理网格分布图以及与每个用户身份标识相对应的多个访问时间,确定待解析区域中各用户身份标识对应的用户的职住地。/n

【技术特征摘要】
1.一种职住地分布的解析方法,其特征在于,所述解析方法包括:
从各平台数据库中获取在预设时间段内待解析区域的多个访问数据;
从所述多个访问数据中识别出用户身份标识信息、访问位置信息和访问时间信息;
以所述用户身份标识信息指示的每个用户身份标识为依据,对所述访问位置信息和所述访问时间信息进行聚合处理,得到与表示同一用户的每个用户身份标识相对应的多个访问位置和多个访问时间;
基于获取的地理网格分布图中各地理网格表示的地理区域以及每个用户对应的多个访问位置,将每个访问位置对应的位置点匹配至对应的地理网格中;
基于预设的工作时间段、休息时间段、匹配后的地理网格分布图以及与每个用户身份标识相对应的多个访问时间,确定待解析区域中各用户身份标识对应的用户的职住地。


2.如权利要求1所述的职住地分布的解析方法,其特征在于,从所述多个访问数据中识别出用户身份标识信息、访问位置信息和访问时间信息包括:
对所述多个访问数据进行格式归一化处理;
从格式归一化处理后的访问数据中识别出用户身份标识信息、访问位置信息和访问时间信息。


3.如权利要求2所述的职住地分布的解析方法,其特征在于,对所述多个访问数据进行格式归一化处理包括:
从所述多个访问数据中表示同类信息的数据按照预设的数据格式存储到待解析数据库中。


4.如权利要求2所述的职住地分布的解析方法,其特征在于,所述用户身份标识信息包括:计算机序列号和手持智能设备序列号;
在对所述多个访问数据进行格式归一化处理之后,从格式归一化处理后的访问数据中识别出用户身份标识信息、访问位置信息和访问时间信息之前,所述解析方法还包括:
从格式归一化处理后的访问数据中获取用户预留信息;
识别出用户预留信息表示同一用户的计算机序列号和手持智能设备序列号,并将该计算机序列号和该手持智能设备序列号确定为表示同一用户的相同用户身份标识。


5.如权利要求1所述职住地分布的解析方法,其特征在于,基于预设的工作时间段、休息时间段、匹配后的地理网格分布图以及与每个用户身份标识相对应的多个访问时间,确定待解析区域中各用户身份标识对应的用户的职住地,包括:
获取预设的工作时间段和预设的休息时间段;
针对每个用户身份标识,从与该用户身份标识相对应的多个访问时间中确定出位于所述工作时间段内的多个第一访问时间和位于所述休息时间段内的多个第二访问时间,以及从与该用户身份标识相对应的多个访问位置中确定出在每个第一访问时间时该用户身份标识的第一访问位置和在每个第二访问时间时该用户身份标识的第二访问位置;
基于每个第一访问位置对应的位置点以及每个第二访问位置对应的位置点,分别从匹配后的地理网格分布图的各地理网格中确定第一目标地理网格和第二目标地理网格,并确定所述第一目标地理网格对应的实际地理区域为该用户身份标识的工作地,以及所述第二目标地理网格对应的实际地理区域为该用户身份标识的居住地;
其中,所述第一目标地理网格中对应的第一访问位置的数量,大于匹配后的地理网格分布图中除所述第一目标地理网格之外的其他地理网格中对应的第一访问位置的数量,所述第二目标地理网格中对应的第二访问位置数量,大于匹配后的地理网格分布图中除所述第二目标地理网格之外的其他地理网格中对应的第二访问位置的数量。


6.一种职住地分布的解析装置,其特征在于,所述装置包括:
获取模块,用于从各平台数据库中获取在预设时间段内待解...

【专利技术属性】
技术研发人员:王江飞刘波苏颖
申请(专利权)人:恩亿科北京数据科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1