【技术实现步骤摘要】
用户行为周期提取方法及设备
本专利技术实施例涉及数据处理
,尤其涉及一种用户行为周期提取方法及设备。
技术介绍
基于手机信令的技术可以追踪用户的移动轨迹,挖掘用户的移动轨迹数据中的用户行为周期是大数据时代的研究热点之一,通过对用户行为周期的分析,在微观上可以理解用户的生活习惯和工作稳定情况,在宏观上可以挖掘区域的人口流动规律,基于此可以向用户进行合适的业务推荐。在现有技术中,可以通过对用户行经的经纬度地点进行区域化分块;对各区域进行以时间序列为轴的用户二值化处理;利用离散傅里叶变换的方法得到用户基于地域的行为周期,还可以通过获取用户行为的时间间隔序列;寻找所述时间间隔序列中相邻元素的波动满足预定条件的周期时间间隔子序列;计算所有所述周期时间间隔子序列的分值;根据所述分值对用户进行分级评价。然而,上述用户行为周期提取方案是在用户移动轨迹数据较完整的情况处理嘈杂扰动值,实际情况中基于基站的用户移动轨迹数据经常存在丢失的情况,并不适用于现有方法,且当数据值缺失较多时,处理扰动噪声值会更加困难。 ...
【技术保护点】
1.一种用户行为周期提取方法,其特征在于,包括:/n获取表征用户移动轨迹的时间序列数据;所述时间序列数据的每个元素的取值是根据用户在该元素对应时间点所处区域的区域编码确定的;所述用户移动轨迹包括第一区域,所述第一区域的区域编码为第一区域编码;/n针对所述第一区域编码对应的预设周期集合中每个预设周期,将所述时间序列数据进行切分,得到该预设周期对应的各分段数据,并根据该各分段数据,确定该预设周期的概率,得到所述第一区域编码对应的所述预设周期集合中各预设周期的概率;/n根据所述第一区域编码对应的所述预设周期集合中各预设周期及其概率,生成周期概率曲线,并获取该周期概率曲线中满足预设 ...
【技术特征摘要】
1.一种用户行为周期提取方法,其特征在于,包括:
获取表征用户移动轨迹的时间序列数据;所述时间序列数据的每个元素的取值是根据用户在该元素对应时间点所处区域的区域编码确定的;所述用户移动轨迹包括第一区域,所述第一区域的区域编码为第一区域编码;
针对所述第一区域编码对应的预设周期集合中每个预设周期,将所述时间序列数据进行切分,得到该预设周期对应的各分段数据,并根据该各分段数据,确定该预设周期的概率,得到所述第一区域编码对应的所述预设周期集合中各预设周期的概率;
根据所述第一区域编码对应的所述预设周期集合中各预设周期及其概率,生成周期概率曲线,并获取该周期概率曲线中满足预设条件的各波峰对应的周期,并将该各波峰对应的周期组合为第一集合;
根据所述第一集合中各周期之间的整数倍关系,确定用户移动轨迹中第一区域编码对应的行为周期,以根据该行为周期对用户进行业务推送。
2.根据权利要求1所述的方法,其特征在于,所述获取表征用户移动轨迹的时间序列数据,包括:
获取用户的移动轨迹数据;所述移动轨迹数据包括时间信息和区域信息;所述时间信息包括起始时间点和终止时间点之间的多个时间点;所述区域信息包括第一区域对应的第一区域编码;
根据所述移动轨迹数据的时间信息和所述区域信息,生成第一数组,作为所述时间序列数据;所述第一数组包括所述起始时间点至所述终止时间点之间的所有时间点对应的元素,其中,所述第一数组中对应于所述多个时间点且对应于所述第一区域编码的元素的取值设为第一标记值,对应于所述多个时间点且对应于其余区域编码的元素的取值设为第二标记值,剩余元素的取值设为第三标记值;
所述根据该各分段数据,确定该预设周期的概率,包括:
根据所述时间序列数据中的第一标记值和第二标记值的数量,确定该预设周期的概率。
3.根据权利要求2所述的方法,其特征在于,所述时间点包括日期和时刻;所述根据所述移动轨迹数据的时间信息和所述区域信息,生成第一数组,包括:
对所述移动轨迹数据进行处理得到第一矩阵;所述第一矩阵为M*N矩阵,M为所述日期中最大值与最小值之间的差值加一,N为时刻范围;所述第一矩阵中对应于所述多个时间点元素的取值设为第一标记值,剩余元素的取值设为第三标记值;
从所述移动轨迹数据中筛选出具有第一区域编码的第一子数据;
根据所述第一子数据,将所述第一矩阵中对应于所述第一子数据中各时间点的各元素的取值更新为第二标记值,得到第二矩阵;
将所述第二矩阵进行一维化,得到所述第一数组。
4.根据权利要求2所述的方法,其特征在于,所述获取用户的移动轨迹数据,包括:
获取表征用户移动...
【专利技术属性】
技术研发人员:张丝雨,崔凌逍,张嘉帅,陈博,张倬荣,孙雅琳,尹杰,赵越,
申请(专利权)人:中国联合网络通信集团有限公司,联通大数据有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。