基于变分自动编码器和制造技术

技术编号:39742704 阅读:20 留言:0更新日期:2023-12-17 23:42
本发明专利技术涉及入侵检测技术领域,公开了基于变分自动编码器和

【技术实现步骤摘要】
基于变分自动编码器和shapelet的时间序列异常检测方法及系统


[0001]本专利技术涉及入侵检测
,具体涉及基于变分自动编码器和
shapelet
的时间序列异常检测方法及系统


技术介绍

[0002]时间序列是时间上相互关联并以有序的方式排列的一组数据,是入侵检测领域的一个重要研究热点

异常值是指不遵循预期行为或者与其他行为相差很远的值,异常检测是对异常值的入侵行为进行识别

时间序列异常检测在实际生活中很常见,比如在医学上使用传感器检测脑电图的变化,正常人的脑电图变化轨迹基本上一致,而患有癫痫或头部造成脑损伤的病人脑电图的变化轨迹会与正常人的脑电图显著不同,也就是异常,传感器可以检测到异常脑电图轨迹,并进行警报提示

[0003]时间异常检测方法可以分为:有监督

无监督和统计分析

大多数时间序列数据集都是没有标签的,因此无监督的异常检测技术更加广泛
。shapelet
可以有效检测不可见测试数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
基于变分自编码器和
shapelet
的时间序列异常检测方法,其特征在于:包括以下具体步骤:
S1、
获取训练用的时间序列的数据集,并通过数据标准化对训练用的时间序列的数据集进行预处理;
S2、
通过
shapelet
算法提取预处理后的数据集的特征序列,将提取出的特征序列转换为
shapelet
特征序列;
S3、
构建基于变分自编码器和
shapelet
的异常检测模型;将
shapelet
特征序列输入到异常检测模型中进行训练,得到隐变量;使用标准化流对隐变量进行可逆映射;根据可逆映射后的隐变量重构特征序列,并计算重构概率为异常分数;
S4、
根据异常分数,通过
SPOT
算法自动计算异常阈值;
S5、
将待测验的时间序列输入到异常检测模型中得到待检测的异常分数,若待检测的异常分数大于步骤
S4
中得到的异常阈值,判断是否为异常序列
。2.
根据权利要求1所述的基于变分自编码器和
shapelet
的时间序列异常检测方法,其特征在于:所述的步骤
S1
中,通过数据标准化对训练用的时间序列的数据集进行预处理,具体为:通过
max

min
归一化对训练用的时间序列的数据集中的数据进行预处理:其中,
x1,x2,

,x
n
是时间序列的数据集中的特征,转换后的数据为:
3.
根据权利要求1所述的基于变分自编码器和
shapelet
的时间序列异常检测方法,其特征在于:所述步骤
S2
中,通过
shapelet
算法提取预处理后的数据集的特征序列,将提取出的特征序列转换为
shapelet
特征序列,具体为:对要预处理后的数据集中的序列进行分段;所有分段点用
u
表示,每段分割后的序列有对应二元组
<K

u>
,其中
K
为该序列的斜率;计算每一个二元组对应的值,得到符号化后的特征序列
TFSA
:其中
K
i

TFSA
的第
i
段序列的斜率,
x
是序列的长度,
v
j
表示时间戳
t
j
在序列中对应的值;从
TFSA
中选出
M
个候选的
shapelet
序列;候选的
shapelet
序列通过信息增益构造出
shapelet
图;从
shapelet
图中选出信息增益最大且不连通的若干个
shapelet
序列,作为
shapelet
特征序列
。4.
根据权利要求3所述的基于变分自编码器和
shapelet
的时间序列异常检测方法,其特征在于:信息增益,具体为:特征在于:信息增益,具体为:其中,
IG
表示信息增益,
E(D)
表示候选的
shapelet
序列
D
L
的熵,
C
表示总的类别数,
m
c
表示各个类别的样本数量,
M
L
表示数据集划分后左边数据集,
M
R
表示划分后右边数据的样本数
据表现,
E(D
L
)
表示候选
shapelet

TFSA
之间的距离小于设定的阈值的序列集信息熵,
E(D
R
)
表示候选
shapelet

TFSA
之间的距离大于设定的阈值的序列集信息熵
。5.
根据权利要求1所述的基于变分自编码器和
shapelet
的时间序列异常检测方法,其特征在于:所述的异常检测模型的解码阶段和编码阶段的第一层均为记忆网络,第二层均为为
Dense layer
;所述的步骤
S3
中,异常检测模型将
shapelet
特征序列作为异常检测模型的输入,使用记忆网络捕获多元空间中观测值之间的时间依赖性,并训练模型获得隐变量;将隐变量作为编码阶段的输入进行序列的可逆映射
。6.
根据权利要求5所述的基于变分自编码器和
shapelet
的时间序列异常检测方法,其特征在于:所述的异常检测模型的损失函数为:其中,
k
表示序列的个数,一个特征序列有
M
组均值和标准差,
σ
j
表示第
j
组的均值,

【专利技术属性】
技术研发人员:凌捷魏月艳罗玉
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1