【技术实现步骤摘要】
数据周期挖掘方法以及相关产品
[0001]本申请涉及互联网
,尤其涉及数据挖掘
,具体涉及一种数据周期挖掘方法以及相关产品。
技术介绍
[0002]随着互联网技术的发展,挖掘对象轨迹数据中的周期模式可以获取到对象的轨迹变化,从而可以预测对象的发展趋势。然而,在挖掘对象轨迹数据的周期序列的过程中,需要知道周期长度才能对对象轨迹数据进行周期性挖掘。目前,主要从对象轨迹数据中获取一个时间集合,并将时间集合中两两时间点之间的差值均作为候选周期,然后基于所有候选周期对对象轨迹数据进行周期性挖掘,得到周期序列。这种方式会确定出海量的候选周期,基于海量的候选周期进行周期序列挖掘会导致周期序列挖掘效率低下。
技术实现思路
[0003]本申请实施例提供了一种数据周期挖掘方法以及相关产品,可以提高周期序列挖掘的效率。
[0004]一方面,本申请实施例提供了一种数据周期挖掘方法,该方法包括:
[0005]获取目标对象访问目标位置的时间集合,所述时间集合包括初始时间点和多个参考时间点,所述初始时间点是指所述目标对象首次访问所述目标位置的时间,参考时间点是指所述目标对象非首次访问所述目标位置的时间;
[0006]获取所述时间集合对应的周期候选集,所述周期候选集包括一个或多个候选周期,所述候选周期满足周期长度条件,和/或所述候选周期在所述时间集合中的出现次数大于次数阈值;
[0007]获取周期挖掘参数,所述周期挖掘参数包括以下一种或多种:周期偏移参数和周期缺失参数;
[0008 ...
【技术保护点】
【技术特征摘要】
1.一种数据周期挖掘方法,其特征在于,包括:获取目标对象访问目标位置的时间集合,所述时间集合包括初始时间点和多个参考时间点,所述初始时间点是指所述目标对象首次访问所述目标位置的时间,参考时间点是指所述目标对象非首次访问所述目标位置的时间;获取所述时间集合对应的周期候选集,所述周期候选集包括一个或多个候选周期;所述候选周期满足周期长度条件,和/或所述候选周期在所述时间集合中的出现次数大于次数阈值;获取周期挖掘参数,所述周期挖掘参数包括以下一种或多种:周期偏移参数和周期缺失参数;基于所述周期挖掘参数和所述周期候选集,对所述时间集合进行周期性挖掘,得到所述目标对象访问所述目标位置的周期序列。2.如权利要求1所述的方法,其特征在于,当所述候选周期满足周期长度条件,和所述候选周期在所述时间集合中的出现次数大于次数阈值时,所述获取所述时间集合对应的周期候选集,包括:将所述时间集合中任意两个时间点之间的差值作为初始候选周期;将满足周期长度条件的初始候选周期均作为参考候选周期;统计每个参考候选周期在所述时间集合中的出现次数,将出现次数大于次数阈值的参考候选周期作为候选周期,并添加到周期候选集中。3.如权利要求1或2所述的方法,其特征在于,所述基于所述周期挖掘参数和所述周期候选集,对所述时间集合进行周期性挖掘,得到所述目标对象访问所述目标位置的周期序列,包括:从所述周期候选集中选取用于轮询的目标候选周期;基于所述目标候选周期和所述周期挖掘参数,对所述时间集合进行周期性挖掘,得到所述目标对象访问所述目标位置的周期序列,并从所述周期候选集中继续选取下一个用于轮询的目标候选周期;当所述周期候选集中预设数量个候选周期被确定为目标候选周期时,停止轮询。4.如权利要求3所述的方法,其特征在于,所述基于所述目标候选周期和所述周期挖掘参数,对所述时间集合进行周期性挖掘,得到所述目标对象访问所述目标位置的周期序列,包括:按照时间点先后顺序遍历所述时间集合,得到挖掘起始时间点;从所述挖掘起始时间点开始,基于所述周期挖掘参数和所述目标候选周期从所述时间集合中确定一个或多个目标挖掘时间点;当停止基于所述目标候选周期和所述周期挖掘参数对所述时间集合进行周期性挖掘时,将所述挖掘起始时间点和所述一个或多个目标挖掘时间点组合为所述目标对象访问所述目标位置的周期序列。5.如权利要求4所述的方法,其特征在于,所述从所述挖掘起始时间点开始,基于所述周期挖掘参数和所述目标候选周期从所述时间集合中确定一个或多个目标挖掘时间点,包括:基于所述挖掘起始时间点和所述目标候选周期确定第一挖掘时间点;
从所述时间集合中查找所述第一挖掘时间点;若未查找到所述第一挖掘时间点,则基于所述第一挖掘时间点、所述周期挖掘参数和所述目标候选周期从时间集合中确定一个或多个目标挖掘时间点。6.如权利要求5所述的方法,其特征在于,所述周期挖掘参数包括:周期偏移参数;所述基于所述第一挖掘时间点、所述周期挖掘参数和所述目标候选周期从时间集合中确定一个或多个目标挖掘时间点,包括:基于所述周期偏移参数和所述目标候选周期确定周期偏移时间长度;基于所述周期偏移时间长度和所述第一挖掘时间点确定偏移挖掘时间点;若从所述时间集合中查找到所述偏移挖掘时间点,则将所述偏移挖掘时间点作为目标挖掘时间点,并基于所述挖掘起始时间点和所述目标候选周期确定下一个第一挖掘时间点。7.如权利要求5或6所述的方法,其特征在于,所述周期挖掘参数还包括周期缺失参数,所述周期缺失参数包括周期连续缺失阈值和周期总缺失阈值;所述方法还包括:若从所述时间集合中未查找到所述偏移挖掘时间点,则对周期连续缺失次数和周期缺失总次数进行更新;若更新后的周期连续缺失次数小于或等于所述周期连续缺失阈值且更新后的周期缺失总次数小于或等于所述周期总缺失阈值,则根据所述第一挖掘时间点和目标候选周期确定第二挖掘时间点;将所述第二挖掘时间点作为所述第一挖掘时间点,继续查找目标挖掘时间点。8.如权利要求5所述的方法,其特征在于,所述周期挖掘参数包括周期缺失参数,所述周期缺失参数包括周期连续缺失阈值和周期总缺失阈值;所述基于所述第一挖掘时间点、所述周期挖掘参数和所述目标候选周期从时间集合中确定一个或多个目标挖掘时间点,包括:对周期连续缺失次数和周期缺失总次数进行...
【专利技术属性】
技术研发人员:钟辉强,刘亮,陈卓明,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。