数据序列的周期提取方法、装置、设备及存储介质制造方法及图纸

技术编号:19480343 阅读:57 留言:0更新日期:2018-11-17 10:34
本发明专利技术实施例公开了一种数据序列的周期提取方法、装置、设备及存储介质。该方法包括:对目标数据序列的周期进行预估,获得预估周期范围;按照设定方式在所述预估周期范围内获取至少一个窗长;在每一个窗长下,获取所述目标数据序列中满足设定条件的极值对;将包括满足设定条件的极值对最多的窗长确定为目标窗长,并提取所述目标窗长下的满足设定条件的极值对以及极值点之间的数据,获得所述目标数据序列的周期。本发明专利技术实施例提供的数据序列的周期提取方法,分别获取不同窗长下满足设定条件的极值对,将包括满足设定条件的极值对最多的窗长下的极值对以及极值对之前的数据进行提取,获得目标数据序列的周期,可以提高周期提取的准确性。

【技术实现步骤摘要】
数据序列的周期提取方法、装置、设备及存储介质
本专利技术实施例涉及数据挖掘
,尤其涉及一种数据序列的周期提取方法、装置、设备及存储介质。
技术介绍
时序数据普遍存在于许多重要应用领域,比如DNA序列、金融数据、传感器网络监测数据、移动对象跟踪数据及机器故障数据等。由于时序数据与时间相关联,因为其数据量一般都非常庞大,那么对时序数据进行数据挖掘显得尤为重要。其中,对时序数据进行周期提取是数据挖掘的重要环节之一。这是由于,将时序数据的周期提取出来之后,就可以只针对1个或几个周期内的数据进行分析,可以极大的减少数据分析的工作量。现有技术中,在对时序数据的周期进行提取时,通常将时序数据转化到频率域,对频率域的数据进分析以获得时序数据的周期,该种方法对于周期比较复杂的数据,准确度较低。
技术实现思路
本专利技术实施例提供一种数据序列的周期提取方法、装置、设备及存储介质,以实现对数据周期的提取,可以提高周期提取的准确性。第一方面,本专利技术实施例提供了一种数据序列的周期提取方法,该方法包括:对目标数据序列的周期进行预估,获得预估周期范围,所述目标数据数列为从数据序列中截取的具有设定长度的数据序列;按照设定方式在所述预估周期范围内获取至少一个窗长;在每一个窗长下,获取所述目标数据序列中满足设定条件的极值对,所述极值对包括极大值对或极小值对;将包括满足设定条件的极值对最多的窗长确定为目标窗长,并提取所述目标窗长下的满足设定条件的极值对以及极值点之间的数据,获得所述目标数据序列的周期。进一步地,在按照设定方式在所述预估周期范围内获取至少一个窗长之后,还包括:获取所述目标数据序列的极大值点和极小值点;获取所述极大值点中的最大值和所述极小值点的最小值;若所述最大值乘以第一设定值与所述最大值之间包含的极大值点的数量大于所述最小值与所述最小值乘以第二设定值之间包含的极小值点的数量,则所述极值对为极小值对;若所述最大值乘以第一设定值与所述最大值之间包含的极大值点的数量小于所述最小值与所述最小值乘以第二设定值之间包含的极小值点的数量,则所述极值对为极大值对。进一步地,当所述极值对为极小值对时,在每一个窗长下,获取所述目标数据序列中满足设定条件的极值对包括:获取所述目标数据序列中的极小值点组成的所有极小值对;对每一个极小值对进行验证,获取满足第一设定子条件的极小值对;其中,第一设定子条件包括:极小值对的两个极小值点的值小于两个极小值点中间的极小值点的值、极小值对的两个极小值点的索引距离小于当前窗长且大于当前窗长乘以第三设定值、极小值对的两个极小值点的值的差值未超过第一设定比例;将当前窗长下所有满足第一设定子条件的极小值对中极小值点的值求取平均值,剔除满足第一设定子条件的极小值对中的极小值点与平均值的差值超过第二设定比例的极小值对,获得满足设定条件的极小值对。进一步地,当所述极值对为极大值对时,在每一个窗长下,获取所述目标数据序列中满足设定条件的极值对包括:获取所述目标数据序列中的极大值点组成的所有极大值对;对每一个极大值对进行验证,获取满足第二设定子条件的极大值对;其中,第二设定子条件包括:极大值对的两个极大值点的值大于两个极大值点中间的极大值点的值、极大值对的两个极大值点的索引距离小于当前窗长且大于当前窗长乘以第四设定值、极大值对的两个极大值点的值的差值未超过第三设定比例;将当前窗长下所有满足第二设定子条件的极大值对中极大值点的值求取平均值,剔除满足第二设定子条件的极大值对中的极大值点与平均值的差值超过第四设定比例的极大值对,获得满足设定条件的极大值对。进一步地,所述按照设定方式在所述预估周期范围内获取至少一个窗长,包括:将所述预估周期范围对应的最小值确定为初始窗长,从所述初始窗长开始并以第五设定值的速率指数增长,获得所述预估周期范围内的至少一个窗长;其中,所述第五设定值分别与第三设定值和第四设定值成倒数关系。进一步地,将包括满足设定条件的极值对最多的窗长确定为目标窗长之前,包括:获取每一个窗长下,满足设定条件情况的极值对的连接情况;剔除不满足设定连接条件的窗长;其中,设定连接条件为:极值对的连接数大于且等于极小值对数乘以第六设定值。进一步地,在每一个窗长下,获取所述目标数据序列中满足设定条件的极值对之后,还包括:在每一个窗长下,采用相似度算法对满足设定条件的极值对进行相似度检测;剔除不满足相似度条件的极值对。第二方面,本专利技术实施例还提供了一种数据序列的周期提取装置,该装置包括:周期范围获取模块,用于对目标数据序列的周期进行预估,获得预估周期范围,所述目标数据数列为从数据序列中截取的具有设定长度的数据序列;窗长获取模块,用于按照设定方式在所述预估周期范围内获取至少一个窗长;极值对获取模块,用于在每一个窗长下,获取所述目标数据序列中满足设定条件的极值对,所述极值对包括极大值对或极小值对;周期获取模块,用于将包括满足设定条件的极值对最多的窗长确定为目标窗长,并提取所述目标窗长下的满足设定条件的极值对以及极值点之间的数据,获得所述目标数据序列的周期。第三方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本专利技术实施例所述的方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例所述的方法。本专利技术实施例,首先对目标数据序列的周期进行预估,获得预估周期范围,然后按照设定方式在预估周期范围内获取至少一个窗长,再然后在每一个窗长下,获取目标数据序列中满足设定条件的极值对,最后将包括满足设定条件的极值对最多的窗长确定为目标窗长,并提取目标窗长下的满足设定条件的极值对以及极值点之间的数据,获得目标数据序列的周期。本专利技术实施例提供的数据序列的周期提取方法,分别获取不同窗长下满足设定条件的极值对,将包括满足设定条件的极值对最多的窗长下的极值对以及极值对之前的数据进行提取,获得目标数据序列的周期,可以提高周期提取的准确性。附图说明图1是本专利技术实施例一中的一种数据序列的周期提取方法的流程图;图2是本专利技术实施例一中的另一种数据序列的周期提取方法的流程图;图3是本专利技术实施例二中的一种数据序列的周期提取装置的结构示意图;图4是本专利技术实施例三中的一种计算机设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种数据序列的周期提取方法的流程图,本实施例可适用于对数据序列的周期进行提取的情况,该方法可以由数据序列的周期提取装置来执行,该装置可由硬件和/或软件组成,并一般可集成在电脑、服务器以及所有包含数据序列的周期提取功能的终端中。如图1所示,该方法具体包括如下步骤。步骤110,对目标数据序列的周期进行预估,获得预估周期范围。其中,目标数据数列为从数据序列中截取的具有设定长度的数据序列。目标数据序列可以是离散的数据序列,设定长度可以是数据序列包含的数据点的个数,例如:设定长度可以设置为100-500之间的本文档来自技高网...

【技术保护点】
1.一种数据序列的周期提取方法,其特征在于,包括:对目标数据序列的周期进行预估,获得预估周期范围,所述目标数据数列为从数据序列中截取的具有设定长度的数据序列;按照设定方式在所述预估周期范围内获取至少一个窗长;在每一个窗长下,获取所述目标数据序列中满足设定条件的极值对,所述极值对包括极大值对或极小值对;将包括满足设定条件的极值对最多的窗长确定为目标窗长,并提取所述目标窗长下的满足设定条件的极值对以及极值点之间的数据,获得所述目标数据序列的周期。

【技术特征摘要】
1.一种数据序列的周期提取方法,其特征在于,包括:对目标数据序列的周期进行预估,获得预估周期范围,所述目标数据数列为从数据序列中截取的具有设定长度的数据序列;按照设定方式在所述预估周期范围内获取至少一个窗长;在每一个窗长下,获取所述目标数据序列中满足设定条件的极值对,所述极值对包括极大值对或极小值对;将包括满足设定条件的极值对最多的窗长确定为目标窗长,并提取所述目标窗长下的满足设定条件的极值对以及极值点之间的数据,获得所述目标数据序列的周期。2.根据权利要求1所述的方法,其特征在于,在按照设定方式在所述预估周期范围内获取至少一个窗长之后,还包括:获取所述目标数据序列的极大值点和极小值点;获取所述极大值点中的最大值和所述极小值点中的最小值;若所述最大值乘以第一设定值与所述最大值之间包含的极大值点的数量大于所述最小值与所述最小值乘以第二设定值之间包含的极小值点的数量,则所述极值对为极小值对;若所述最大值乘以第一设定值与所述最大值之间包含的极大值点的数量小于所述最小值与所述最小值乘以第二设定值之间包含的极小值点的数量,则所述极值对为极大值对。3.根据权利要求2所述的方法,其特征在于,当所述极值对为极小值对时,在每一个窗长下,获取所述目标数据序列中满足设定条件的极值对,包括:获取所述目标数据序列中的极小值点组成的所有极小值对;对每一个极小值对进行验证,获取满足第一设定子条件的极小值对;其中,第一设定子条件包括:极小值对的两个极小值点的值小于两个极小值点中间的极小值点的值、极小值对的两个极小值点的索引距离小于当前窗长且大于当前窗长乘以第三设定值、极小值对的两个极小值点的值的差值未超过第一设定比例;将当前窗长下所有满足第一设定子条件的极小值对中极小值点的值求取平均值,剔除满足第一设定子条件的极小值对中的极小值点与平均值的差值超过第二设定比例的极小值对,获得满足设定条件的极小值对。4.根据权利要求2所述的方法,其特征在于,当所述极值对为极大值对时,在每一个窗长下,获取所述目标数据序列中满足设定条件的极值对,包括:获取所述目标数据序列中的极大值点组成的所有极大值对;对每一个极大值对进行验证,获取满足第二设定子条件的极大值对;其中,第二设定子条件包括:极大值对的两个极大值点的值大于两个极大值点...

【专利技术属性】
技术研发人员:谈剑锋刘敬民杨德光姜立稳
申请(专利权)人:上海众人网络安全技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1