数据周期挖掘方法以及相关产品技术

技术编号:38221635 阅读:6 留言:0更新日期:2023-07-25 17:53
本申请实施例提供了一种数据周期挖掘方法以及相关产品,其中方法包括:获取目标对象访问目标位置的时间集合,获取时间集合对应的周期候选集,周期候选集包括一个或多个候选周期,候选周期满足周期长度条件,和/或候选周期在时间集合中的出现次数大于次数阈值;获取周期挖掘参数,周期挖掘参数包括以下一种或多种:周期偏移参数和周期缺失参数;基于周期挖掘参数和周期候选集,对时间集合进行周期性挖掘,得到目标对象访问目标位置的周期序列,可以提高周期序列挖掘的效率。以提高周期序列挖掘的效率。以提高周期序列挖掘的效率。

【技术实现步骤摘要】
数据周期挖掘方法以及相关产品


[0001]本申请涉及互联网
,尤其涉及数据挖掘
,具体涉及一种数据周期挖掘方法以及相关产品。

技术介绍

[0002]随着互联网技术的发展,挖掘对象轨迹数据中的周期模式可以获取到对象的轨迹变化,从而可以预测对象的发展趋势。然而,在挖掘对象轨迹数据的周期序列的过程中,需要知道周期长度才能对对象轨迹数据进行周期性挖掘。目前,主要从对象轨迹数据中获取一个时间集合,并将时间集合中两两时间点之间的差值均作为候选周期,然后基于所有候选周期对对象轨迹数据进行周期性挖掘,得到周期序列。这种方式会确定出海量的候选周期,基于海量的候选周期进行周期序列挖掘会导致周期序列挖掘效率低下。

技术实现思路

[0003]本申请实施例提供了一种数据周期挖掘方法以及相关产品,可以提高周期序列挖掘的效率。
[0004]一方面,本申请实施例提供了一种数据周期挖掘方法,该方法包括:
[0005]获取目标对象访问目标位置的时间集合,所述时间集合包括初始时间点和多个参考时间点,所述初始时间点是指所述目标对象首次访问所述目标位置的时间,参考时间点是指所述目标对象非首次访问所述目标位置的时间;
[0006]获取所述时间集合对应的周期候选集,所述周期候选集包括一个或多个候选周期,所述候选周期满足周期长度条件,和/或所述候选周期在所述时间集合中的出现次数大于次数阈值;
[0007]获取周期挖掘参数,所述周期挖掘参数包括以下一种或多种:周期偏移参数和周期缺失参数;
[0008]基于所述周期挖掘参数和所述周期候选集,对所述时间集合进行周期性挖掘,得到所述目标对象访问所述目标位置的周期序列。
[0009]一方面,本申请实施例提供了一种数据周期挖掘装置,该装置包括:
[0010]获取单元,用于获取目标对象访问目标位置的时间集合,所述时间集合包括初始时间点和多个参考时间点,所述初始时间点是指所述目标对象首次访问所述目标位置的时间,参考时间点是指所述目标对象非首次访问所述目标位置的时间;
[0011]所述获取单元,还用于获取所述时间集合对应的周期候选集,所述周期候选集包括一个或多个候选周期,所述候选周期满足周期长度条件,和/或所述候选周期在所述时间集合中的出现次数大于次数阈值;
[0012]所述获取单元,还用于获取周期挖掘参数,所述周期挖掘参数包括以下一种或多种:周期偏移参数和周期缺失参数;
[0013]所述处理单元,用于基于所述周期挖掘参数和所述周期候选集,对所述时间集合
进行周期性挖掘,得到所述目标对象访问所述目标位置的周期序列。
[0014]一方面,申请实施例提供一种数据挖掘设备,该数据挖掘设备包括输入设备、输出设备、处理器和计算机存储介质,该处理器和计算机存储介质相互连接,其中,计算机存储介质用于存储计算机程序,该处理器被配置用于调用计算机程序,执行上述数据周期挖掘方法。
[0015]一方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序被处理器执行时,用于实现上述数据周期挖掘方法。
[0016]一方面,本申请实施例提供了一种计算机程序产品,计算机程序产品包括计算机程序;该计算机程序存储在计算机可读存储介质中,计算机程序被数据挖掘设备的处理器执行时,执行上述数据周期挖掘方法。
[0017]在本申请实施例中,获取目标对象访问目标位置的时间集合;并获取时间集合对应的周期候选集,周期候选集包括一个或多个候选周期,候选周期满足周期长度条件,和/或候选周期在时间集合中的出现次数大于次数阈值;获取周期挖掘参数,周期挖掘参数包括以下一种或多种:周期偏移参数和周期缺失参数;基于周期挖掘参数和周期候选集,对时间集合进行周期性挖掘,得到目标对象访问目标位置的周期序列。利用周期长度条件和次数阈值可以筛选出合适的候选周期集,无需获取全部的候选周期用于对时间集合的周期性挖掘,减少了周期挖掘的工作量,提高了周期序列挖掘的效率。
附图说明
[0018]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1a是本申请实施例提供的一种轨迹数据存在周期偏移和缺失的示意图;
[0020]图1b是本申请实施例提供的一种数据推荐系统的架构示意图;
[0021]图2是本申请实施例提供的一种数据周期挖掘方法的流程示意图;
[0022]图3a是本申请实施例提供的一种参考停留位置检测的示意图;
[0023]图3b是本申请实施例提供的一种参考停留位置进行聚类的示意图;
[0024]图3c是本申请实施例提供的一种对轨迹数据去噪的示意图;
[0025]图4是本申请实施例提供的另一种数据周期挖掘方法的流程示意图;
[0026]图5是本申请实施例提供的又一种数据周期挖掘方法的流程示意图;
[0027]图6a

图6e是本申请实施例提供的一种对时间集合进行周期性挖掘的流程示意图;
[0028]图6f是本申请实施例提供的一种周期连续缺失的示意图;
[0029]图6g是本申请实施例提供的一种在周期连续缺失次数大于周期连续缺失阈值情况下添加停止挖掘的标记的示意图;
[0030]图6h是本申请实施例提供的一种在周期缺失总次数大于周期总缺失阈值情况下停止挖掘的示意图;
[0031]图7是本申请实施例提供的一种轨迹数据存在周期偏移的示意图;
[0032]图8是本申请实施例提供的一种数据周期挖掘装置的结构示意图;
[0033]图9是本申请实施例提供的一种数据挖掘设备的结构示意图。
具体实施方式
[0034]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0035]应理解的是,在本申请的具体实施方式中,涉及到用户轨迹数据、用户轨迹位置等相关的数据,当本申请实施例中运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
[0036]大数据(Big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临,大数据也吸引了越来越多的关注,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据周期挖掘方法,其特征在于,包括:获取目标对象访问目标位置的时间集合,所述时间集合包括初始时间点和多个参考时间点,所述初始时间点是指所述目标对象首次访问所述目标位置的时间,参考时间点是指所述目标对象非首次访问所述目标位置的时间;获取所述时间集合对应的周期候选集,所述周期候选集包括一个或多个候选周期;所述候选周期满足周期长度条件,和/或所述候选周期在所述时间集合中的出现次数大于次数阈值;获取周期挖掘参数,所述周期挖掘参数包括以下一种或多种:周期偏移参数和周期缺失参数;基于所述周期挖掘参数和所述周期候选集,对所述时间集合进行周期性挖掘,得到所述目标对象访问所述目标位置的周期序列。2.如权利要求1所述的方法,其特征在于,当所述候选周期满足周期长度条件,和所述候选周期在所述时间集合中的出现次数大于次数阈值时,所述获取所述时间集合对应的周期候选集,包括:将所述时间集合中任意两个时间点之间的差值作为初始候选周期;将满足周期长度条件的初始候选周期均作为参考候选周期;统计每个参考候选周期在所述时间集合中的出现次数,将出现次数大于次数阈值的参考候选周期作为候选周期,并添加到周期候选集中。3.如权利要求1或2所述的方法,其特征在于,所述基于所述周期挖掘参数和所述周期候选集,对所述时间集合进行周期性挖掘,得到所述目标对象访问所述目标位置的周期序列,包括:从所述周期候选集中选取用于轮询的目标候选周期;基于所述目标候选周期和所述周期挖掘参数,对所述时间集合进行周期性挖掘,得到所述目标对象访问所述目标位置的周期序列,并从所述周期候选集中继续选取下一个用于轮询的目标候选周期;当所述周期候选集中预设数量个候选周期被确定为目标候选周期时,停止轮询。4.如权利要求3所述的方法,其特征在于,所述基于所述目标候选周期和所述周期挖掘参数,对所述时间集合进行周期性挖掘,得到所述目标对象访问所述目标位置的周期序列,包括:按照时间点先后顺序遍历所述时间集合,得到挖掘起始时间点;从所述挖掘起始时间点开始,基于所述周期挖掘参数和所述目标候选周期从所述时间集合中确定一个或多个目标挖掘时间点;当停止基于所述目标候选周期和所述周期挖掘参数对所述时间集合进行周期性挖掘时,将所述挖掘起始时间点和所述一个或多个目标挖掘时间点组合为所述目标对象访问所述目标位置的周期序列。5.如权利要求4所述的方法,其特征在于,所述从所述挖掘起始时间点开始,基于所述周期挖掘参数和所述目标候选周期从所述时间集合中确定一个或多个目标挖掘时间点,包括:基于所述挖掘起始时间点和所述目标候选周期确定第一挖掘时间点;
从所述时间集合中查找所述第一挖掘时间点;若未查找到所述第一挖掘时间点,则基于所述第一挖掘时间点、所述周期挖掘参数和所述目标候选周期从时间集合中确定一个或多个目标挖掘时间点。6.如权利要求5所述的方法,其特征在于,所述周期挖掘参数包括:周期偏移参数;所述基于所述第一挖掘时间点、所述周期挖掘参数和所述目标候选周期从时间集合中确定一个或多个目标挖掘时间点,包括:基于所述周期偏移参数和所述目标候选周期确定周期偏移时间长度;基于所述周期偏移时间长度和所述第一挖掘时间点确定偏移挖掘时间点;若从所述时间集合中查找到所述偏移挖掘时间点,则将所述偏移挖掘时间点作为目标挖掘时间点,并基于所述挖掘起始时间点和所述目标候选周期确定下一个第一挖掘时间点。7.如权利要求5或6所述的方法,其特征在于,所述周期挖掘参数还包括周期缺失参数,所述周期缺失参数包括周期连续缺失阈值和周期总缺失阈值;所述方法还包括:若从所述时间集合中未查找到所述偏移挖掘时间点,则对周期连续缺失次数和周期缺失总次数进行更新;若更新后的周期连续缺失次数小于或等于所述周期连续缺失阈值且更新后的周期缺失总次数小于或等于所述周期总缺失阈值,则根据所述第一挖掘时间点和目标候选周期确定第二挖掘时间点;将所述第二挖掘时间点作为所述第一挖掘时间点,继续查找目标挖掘时间点。8.如权利要求5所述的方法,其特征在于,所述周期挖掘参数包括周期缺失参数,所述周期缺失参数包括周期连续缺失阈值和周期总缺失阈值;所述基于所述第一挖掘时间点、所述周期挖掘参数和所述目标候选周期从时间集合中确定一个或多个目标挖掘时间点,包括:对周期连续缺失次数和周期缺失总次数进行...

【专利技术属性】
技术研发人员:钟辉强刘亮陈卓明
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1