The invention discloses a cycle acquisition method based on relative entropy. The cycle acquisition method based on relative entropy includes: step 1, acquiring the observation sequence of the user to be studied in the spatiotemporal database in a predetermined time period; step 2, determining two or more candidate periods T according to the observation sequence of step 1; step 3, calculating the relative of each candidate period T in step 2. Entropy, and the candidate period T corresponding to the maximum of relative entropy is taken as the real period. The method uses the superposition distribution observed on the segmented interval to discover the real period, and uses relative entropy to measure the difference between the superposition distribution after the segmented sequence and the uniform distribution on the candidate period, and as a criterion to judge whether the real period is true or not. The method of the invention is particularly suitable for mining the periodic behavior period of human beings in spatiotemporal data.
【技术实现步骤摘要】
一种基于相对熵的周期获取方法
本专利技术涉及周期发现
,特别是涉及一种基于相对熵的周期获取方法。
技术介绍
周期行为是人类社会最为普遍的一种行为,比如工作日往返于办公室和住所的通勤行为;周末定期举行的家庭聚会或各种娱乐等活动;每月定期的个人所得税上报行为;每年的生日或结婚纪念日的庆祝活动等。随着基于位置服务的流行,以及IOT设备的发展,获得了海量的时空数据,记录了大量的人类行为。因此,时空数据中记录了相当可观的人类周期行为。挖掘和分析人类的周期行为有着广泛的应用,包括公共安全,犯罪预防,隐私保护,以及人群移动预测等。人类周期行为挖掘指发现在固定时间间隔会发生的人类行为。周期发现是周期行为挖掘中最为重要的任务。过去的十几年,出现许多周期获取方法,比如:快速傅立叶变换(FFT)和自相关算法。然而,时空数据包含的单个用户历史记录往往是稀疏的,观测不完全,采样不均匀,且包含噪声。其次,因为人类行为是复杂性,所以周期行为不是严格在某个固定的时间点发生,而是在一个时间范围内波动。这些算法的对象是稠密,观测完全,采样均匀的物理的信号系统,因此无法直接应用在时空数据中周期行为的挖掘中。近些年,研究者也提出了多种针对时空数据的周期发现技术,比如WARP、Lomb-Scargle图谱、自相关和FFT相结合的技术。但是这些技术都存在假设太强烈、精度不高或者算法时间复杂度过高的问题。因此,希望有一种技术方案来克服或至少减轻现有技术的上述缺陷中的至少一个。
技术实现思路
本专利技术的目的在于提供一种基于相对熵的周期获取方法来克服或至少减轻现有技术的上述缺陷中的至少一个。为实现上述 ...
【技术保护点】
1.一种基于相对熵的周期获取方法,其特征在于,包括:步骤1,获取时空数据库中待研究用户在预设时间段内的观测序列;步骤2,根据步骤1的观测序列,确定两个或两个以上的候选周期T;步骤3,计算步骤2中的每一个候选周期T的相对熵,并将相对熵中的最大值对应的候选周期T作为真实周期。
【技术特征摘要】
1.一种基于相对熵的周期获取方法,其特征在于,包括:步骤1,获取时空数据库中待研究用户在预设时间段内的观测序列;步骤2,根据步骤1的观测序列,确定两个或两个以上的候选周期T;步骤3,计算步骤2中的每一个候选周期T的相对熵,并将相对熵中的最大值对应的候选周期T作为真实周期。2.如权利要求1所述的基于相对熵的周期获取方法,其特征在于,步骤3具体包括:步骤31,将按照步骤2确定好的候选周期T,将步骤1提供的观测序列切分成片段;步骤32,将步骤31切分好的片段在对应的候选周期T内进行叠加;步骤33,获取长度为T的时间段内的每个离散时间点上观测到的事件Si(T);步骤34,根据步骤33获得的事件Si(T),获取观测序列经过候选周期T切分后叠加的落在i位置处的分布pi(T);步骤35,根据步骤34获得的pi(T),获取候选周期T的熵H(T);步骤36,根据步骤34获得的熵H(T),获取候选周期T的相对熵;KL*(pi(T)||qi(T))步骤37,返回步骤31,获取每一个候选周期T对应的相对熵KL*(pi(T)||qi(T)),并选取数值最小的相对熵KL*(pi(T)||qi(T))对应的候选周期T作为真实周期。3.如权利要求2所述的基于相对熵的周期获取方法,其特征在于,步骤33中,利用式(1)表示长度为T的时间段内每个离散时间点上观测到的事件:Si(T)={t|mod(t,T)=i∧I(t)=1},t=0,1,...
【专利技术属性】
技术研发人员:易锋,
申请(专利权)人:电子科技大学中山学院,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。