联合小波变换和马尔可夫模型的时间序列异常检测方法技术

技术编号:39293108 阅读:11 留言:0更新日期:2023-11-07 11:01
本发明专利技术公开了一种联合小波变换和马尔可夫模型的时间序列异常检测方法,包括:获取原始时间序列数据;对所述原始时间序列数据进行小波分解,再进行小波重构,以得到重构时间序列;构建所述重构时间序列的区间信息粒;利用马尔可夫模型计算各个区间信息粒的异常分数;若所述区间信息粒的异常分数大于预设的阈值,则该区间信息粒为异常。本发明专利技术结合小波变换和粒度马尔可夫模型对时间序列进行异常检测,能够更全面地分析时间序列的时空特征和动态变化,而不仅仅关注于数值大小;通过综合考虑多尺度特征和状态转移模式,能够更精确地识别和定位异常,具有较高的灵敏度和鲁棒性。具有较高的灵敏度和鲁棒性。具有较高的灵敏度和鲁棒性。

【技术实现步骤摘要】
联合小波变换和马尔可夫模型的时间序列异常检测方法


[0001]本专利技术涉及时空大数据领域,尤其涉及一种联合小波变换和粒度马尔可夫模型的时间序列异常检测方法。

技术介绍

[0002]随着物联网(IoT)、传感器等在各个领域的应用,各种类型的时间序列数据可以从中获得。当这样的时间序列数据显着偏离特定模式时,这种偏离被检测为异常。异常检测通常必须在真实世界的流应用程序上进行,针对时空信息处理领域,一些时序波动分析中存在数据量大、有噪声等特点,使得时序数据挖掘及其异常检测的工作具有挑战性。
[0003]目前有使用深度学习技术学习时间序列数据内的各种模式,深度学习模型使用基于卷积神经网络(CNN)的自动编码器或基于递归神经网络(RNN)的自动编码器来检测时间序列数据异常。
[0004]由于异常是一种不符合过去行为模式的模式,因此非异常数据的出现量往往比异常数据大得多。这可能会给异常检测的机器学习分类器方法带来问题,因为类的表示不均等。因此,准确度度量可能会呈现出色的结果,但准确度仅反映了数据中不平等的类别分布(准确度悖论)。
[0005]以上
技术介绍
内容的公开仅用于辅助理解本专利技术的专利技术构思及技术方案,其并不必然属于本专利申请的现有技术,也不必然会给出技术教导;在没有明确的证据表明上述内容在本专利申请的申请日之前已经公开的情况下,上述
技术介绍
不应当用于评价本申请的新颖性和创造性。

技术实现思路

[0006]本专利技术的目的是从时间序列中挖掘关键信息并将其应用于时间序列的异常检测,提出了一种联合小波变换和马尔可夫模型的时间序列异常检测方法。
[0007]为达到上述目的,本专利技术采用的技术方案如下:
[0008]一种联合小波变换和马尔可夫模型的时间序列异常检测方法,包括以下步骤:
[0009]获取原始时间序列数据;
[0010]对所述原始时间序列数据进行小波分解,再进行小波重构,以得到重构时间序列;
[0011]构建所述重构时间序列的区间信息粒;
[0012]利用马尔可夫模型计算各个区间信息粒的异常分数;
[0013]若所述区间信息粒的异常分数大于预设的阈值,则该区间信息粒为异常。
[0014]进一步地,承前所述的任一技术方案或多个技术方案的组合,所述对所述原始时间序列数据进行小波分解,再进行小波重构,以得到重构时间序列包括:
[0015]选择小波分解函数和分解级数,将所述原始时间序列数据分解为不同尺度的小波系数,所述小波系数包括逼近系数和细节系数;
[0016]在分解得到的各个逼近系数和细节系数中选择保留的系数;
[0017]选择小波重构函数将所述保留的系数合成,得到所述重构时间序列。
[0018]进一步地,承前所述的任一技术方案或多个技术方案的组合,wavedec函数使用Daubechies小波基函数对所述原始时间序列数据进行分解,并返回小波系数;
[0019]waverec函数使用wavedec函数返回的小波系数和所述Daubechies小波基函数对信号进行重构,以得到所述重构时间序列。
[0020]进一步地,承前所述的任一技术方案或多个技术方案的组合,设置所述分解级数为四级,分解后的小波系数的前N个为逼近系数,其中,N为介于1至5的整数,其余分解后的小波系数为细节系数;
[0021]保留所述逼近系数,并将所述细节系数设置为0;
[0022]小波重构函数使用所述逼近系数和Daubechies 4小波基函数对信号进行重构,以得到所述重构时间序列。
[0023]进一步地,承前所述的任一技术方案或多个技术方案的组合,所述重构时间序列X(n)对应区间[a,b]的信息粒通过以下方式构建:
[0024]确定优化后的区间限值为:
[0025]V(b)=f1(card{x(k)∈X(n)|med(X(n))≤x(k)≤b})*f2(|med(X(n))

b|) (1),
[0026]V(a)=f1(card{x(k)∈X(n)|a≤x(k)<med(X(n))})*f2(|med(X(n))

a|) (2),
[0027]其中,V(b)表示区间上限值的优化值,card{x(k)∈X(n)∣med(X(n))≤x(k)≤b}表示重构时间序列X(n)中所有数据x(k)落在介于med(X(n))与b的区间内的个数,med(X(n))表示重构时间序列X(n)的中值,n为重构时间序列X(n)中的数据数量,k为小于或等于n的整数,x(k)为重构时间序列X(n)中第k个数据;b表示区间上限值;f1()为第一优化子函数,f2()为第二优化子函数;
[0028]V(a)表示区间下限值的优化值,card{x(k)∈X(n)∣a≤x(k)<med(X(n))}表示重构时间序列X(n)中所有数据x(k)落在介于a与med(X(n))区间内的个数,a表示区间下限值;
[0029]通过独立最大化公式(1),得到信息粒的上界值;及通过独立最大化公式(2),得到信息粒的下界值。
[0030]进一步地,承前所述的任一技术方案或多个技术方案的组合,所述第一优化子函数为f1(ε)=ε;
[0031]所述第二优化子函数为f2(ε)=exp(

aε),其中,a表示区间下限值。
[0032]进一步地,承前所述的任一技术方案或多个技术方案的组合,利用马尔可夫模型计算各个区间信息粒的异常分数之前,还包括使用马尔可夫库对所述区间信息粒进行模糊聚类,得到区间信息粒模糊划分关系矩阵;
[0033]根据所述区间信息粒模糊划分关系矩阵计算区间信息粒中所有状态的初始概率分布集Q;
[0034]根据所述初始概率分布集Q计算区间信息粒中所有状态的转移概率矩阵P;
[0035]所述马尔可夫模型的参数集表示为其中,为马尔可夫模型;S为区间信息粒中存在的状态数,其在构建所述重构时间序列的区间信息粒时被确定;
[0036]基于各个信息粒对应的参数S,P,Q,所述马尔可夫模型生成各个信息粒的异常分数。
[0037]进一步地,承前所述的任一技术方案或多个技术方案的组合,使用马尔可夫库对
所述区间信息粒进行模糊聚类包括以下步骤:
[0038]使用c(c≤n)个聚类中心的集合v1,v2,

,vc,设计模糊划分关系矩阵U=[u
ki
]使以下目标函数最小化:
[0039][0040]其中,J为目标函数,c为聚类中心的数量,n为重构时间序列X(n)中的数据数量,m为超参数,为数据点和聚类中心的关系,u
ki
为n
×
c模糊划分关系矩阵中的元素,其代表第k个数据点对第i个聚类中心的隶属度,v
i
为第i个聚类中心,x
k
为第k个数据点,||v
i
...

【技术保护点】

【技术特征摘要】
1.一种联合小波变换和马尔可夫模型的时间序列异常检测方法,其特征在于,包括以下步骤:获取原始时间序列数据;对所述原始时间序列数据进行小波分解,再进行小波重构,以得到重构时间序列;构建所述重构时间序列的区间信息粒;利用马尔可夫模型计算各个区间信息粒的异常分数;若所述区间信息粒的异常分数大于预设的阈值,则该区间信息粒为异常。2.根据权利要求1所述的联合小波变换和马尔可夫模型的时间序列异常检测方法,其特征在于,所述对所述原始时间序列数据进行小波分解,再进行小波重构,以得到重构时间序列包括:选择小波分解函数和分解级数,将所述原始时间序列数据分解为不同尺度的小波系数,所述小波系数包括逼近系数和细节系数;在分解得到的各个逼近系数和细节系数中选择保留的系数;选择小波重构函数将所述保留的系数合成,得到所述重构时间序列。3.根据权利要求2所述的联合小波变换和马尔可夫模型的时间序列异常检测方法,其特征在于,wavedec函数使用Daubechies小波基函数对所述原始时间序列数据进行分解,并返回小波系数;waverec函数使用wavedec函数返回的小波系数和所述Daubechies小波基函数对信号进行重构,以得到所述重构时间序列。4.根据权利要求2所述的联合小波变换和马尔可夫模型的时间序列异常检测方法,其特征在于,设置所述分解级数为四级,分解后的小波系数的前N个为逼近系数,其中,N为介于1至5的整数,其余分解后的小波系数为细节系数;保留所述逼近系数,并将所述细节系数设置为0;小波重构函数使用所述逼近系数和Daubechies 4小波基函数对信号进行重构,以得到所述重构时间序列。5.根据权利要求1所述的联合小波变换和马尔可夫模型的时间序列异常检测方法,其特征在于,所述重构时间序列X(n)对应区间[a,b]的信息粒通过以下方式构建:确定优化后的区间限值为:V(b)=f1(card{x(k)∈X(n)|med(X(n))≤x(k)≤b})*f2(|med(X(n))

b|) (1),V(a)=f1(card{x(k)∈X(n)|a≤x(k)<med(X(n))})*f2(|med(X(n))

a|) (2),其中,V(b)表示区间上限值的优化值,card{x(k)∈X(n)∣med(X(n))≤x(k)≤b}表示重构时间序列X(n)中所有数据x(k)落在介于med(X(n))与b的区间内的个数,med(X(n))表示重构时间序列X(n)的中值,n为重构时间序列X(n)中的数据数量,k为小于或等于n的整数,x(k)为重构时间序列X(n)中第k个数据;b表示区间上限值;f1()为第一优化子函数,f2()为第二优化子函数;V(a)表示区间下限值的优化值,card{x(k)∈X(n)∣a≤x(k)<med(X(n))}表示重构...

【专利技术属性】
技术研发人员:李军利涂有军王雅楠邵婷高钰鑫赵彤
申请(专利权)人:安徽农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1