一种时序数据的数据周期测定方法及系统技术方案

技术编号:34488912 阅读:32 留言:0更新日期:2022-08-10 09:07
一种时序数据的数据周期测定方法及系统,其包括采用滑动窗口信息熵的周期测定方法,获得数据序列周期的候选值;采用质因数分解的方法,对所述候选值进行筛选以得到数据序列的最小周期,其解决了现有的周期测定方法存在着易受噪音点异常点的影响、处理稀疏型周期数据效果不理想、依赖于人工先验周期知识、无法处理具有多周期的时序数据等方面的缺陷,且本发明专利技术具有较强的泛化能力,可广泛应用于大数据处理领域。领域。领域。

【技术实现步骤摘要】
一种时序数据的数据周期测定方法及系统


[0001]本专利技术涉及大数据处理领域,尤其是涉及一种时序数据的数据周期测定方法及系统。

技术介绍

[0002]在大数据时代的当下,各行各业需要进行挖掘和监测的数据规模越来越庞大,数据种类越来越复杂,在这些数据中时序数据占据相当大的比重,而实际生产生活中的时序数据经常会重复出现一些相同或相似的模式,即周期性,这些数据的周期性往往蕴含着巨大的价值,由此便进一步催生出对数据周期测定方法的需要。然而目前大多数周期测定方法比如基于自相关函数的方法以及基于周期图的方法已经不适应于当下的环境,不同的业务场景下数据采集模式数据采集粒度各不相同导致难以人为设置一些先验周期知识,噪声点异常点的干扰,无法处理多周期数据等等一系列现实因素的限制使得人们迫切需要一套新的周期测定方法。
[0003]虽然对于信息熵用作周期测定已有一定应用先例,但通过对现有信息熵测定周期方法调研,现有方法是通过已采集好的数据序列直接计算其信息熵从而反映出在某一时间段内数据序列的信息变化强度,并由此进行频域测算从而推断数据序列周期值大小。这样的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种时序数据的数据周期测定方法,其特征在于,包括:采用滑动窗口信息熵的周期测定方法,获得数据序列周期的候选值;采用质因数分解的方法,对所述候选值进行筛选以得到数据序列的最小周期。2.根据权利要求1所述的一种时序数据的数据周期测定方法,其特征在于,所述滑动窗口信息熵的周期测定方法,具体通过以下方式实现:通过在时序数据的数据序列上进行窗口滑动从而获得各窗口内数据的信息熵;根据信息熵判断各窗口内所包含数据序列的信息熵的波动情况,得到二维图像;根据所述二维图像确定数据序列周期的候选值。3.根据权利要求2所述的一种时序数据的数据周期测定方法,其特征在于,所述二维图像的获取,具体通过以下方式实现:通过计算对应窗口大小下所得信息熵的方差从而反映出在该窗口大小下窗口滑动时窗口内所包含数据序列的信息熵的波动情况,以画出信息熵方差与其对应窗口大小的二维图像。4.根据权利要求3所述的一种时序数据的数据周期测定方法,其特征在于,所述信息熵的波动情况,具体通过以下方式判断:当窗口大小等于数据序列周期大小时,窗口内所包含的数据序列的信息...

【专利技术属性】
技术研发人员:王佰玲张力仁王凯刘扬刘红日
申请(专利权)人:威海天之卫网络空间安全科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1