【技术实现步骤摘要】
一种基于一致性学习的模糊分段时间序列分类方法和系统
[0001]本专利技术涉及时间序列和模式识别
,尤其涉及一种基于一致性学习的模糊分段时间序列分类方法和系统
。
技术介绍
[0002]时间序列分类
(Time series classification
,
TSC)
是数据挖掘领域的一个热门研究方向,近年来随着时间序列数据的快速增长,其重要性日益凸显
。
为此,研究人员提出了许多算法
[Hassan 2019]。
传统算法如
Rocket
及其变种
[Dempster 2020,Dempster 2021]以及
HIVE
‑
COTE
等集成方法
[Lines 2018]在
TSC
中取得了较高的准确性,它们利用了相对较低计算成本的随机卷积核,同时对个体分类器进行加权
。
此外,深度模型的非线性建模能力的提升导致了基于深度学习的
TSC
算法越来越普遍
。TSC
中采用了多种技术:基于循环神经网络
(RNN)
的方法
[Rajan 2018,Shen 2020]通过状态转换捕捉时间变化;基于多层感知机
(MLP)
的方法
[Challu 2022,Zhang 2022]将时间依赖关系编码为
MLP
层的参数;最新的
TimesNet
...
【技术保护点】
【技术特征摘要】
1.
一种基于一致性学习的模糊分段时间序列分类方法,其特征在于,包括:将给定的时间序列数据划分为若干时间段;利用编码器模块提取各时间段的局部表示,基于所述的局部表征编码各时间段的全局关联表示;利用上下文感知的连贯预测模块根据各时间段的全局关联表示进行自身预测和上下文预测,根据双曲正切函数拟合上下文预测的单调性,得到约束后的上下文预测;结合自身预测和约束后的上下文预测得到各时间段的最终预测
。2.
根据权利要求1所述的方法,其特征在于,所述的编码器模块和上下文感知的连贯预测模块采用层次化训练方法,包括:给定一段时间序列数据,将其按照不同类别划分为若干子序列,将每一子序列从中心点向边界划分成由低到高不同层次,从各层次子序列中采样相同数量的时间段作为样本;按照由低到高不同层次划分训练批次,根据各时间段样本的原始标签
、
自身预测结果
、
约束后的上下文预测结果和训练进度,更新每轮训练的协调标签;对于每轮训练,根据当前轮次的协调标签和上下文感知的连贯预测模块得到的自身预测结果计算自身预测的交叉熵损失函数;将不同时间段的全局关联表示两两拼接,根据拼接后的表示判断两两时间段是否属于同一类别,获得一致性判别结果,利用一致性判别结果与真实一致性标签计算上下文预测的交叉熵损失函数;基于两个交叉熵损失函数训练所述的编码器模块和上下文感知的连贯预测模块
。3.
根据权利要求2所述的方法,其特征在于,所述的利用上下文感知的连贯预测模块根据各时间段的全局关联表示进行上下文预测,具体为:将不同时间段的全局关联表示两两拼接,对拼接后的表示进行邻居标签一致性判别,获得一致性判别结果,以获得的一致性判别结果为权重向量,将权重向量与相对应时间段的自身预测结果的乘积作为该时间段的上下文预测结果
。4.
根据权利要求2所述的基于一致性学习的模糊分段时间序列分类方法,其特征在于,所述的将每一子序列从中心点向边界划分成由低到高不同层次,从各层次子序列中采样相同数量的时间段作为样本,包括:对于一个长度为
K
的子序列,将其划分为等长的5个层次:从各层次的子序列中采样相同数量且等长的时间序列;针对每一个采样到的时间序列,设定一个长度为
W、
滑动距离为
S
的滑动窗口,对其进行分段划分,将每一个时间段作为一个样本
。5.
根据权利要求2所述的基于一致性学习的模糊分段时间序列分类方法,其特征在于,所述的按照由低到高不同层次划分训练批次,根据各时间段样本的原始标签
、
自身预测结果
、
约束后的上下文预测结果和训练进度,更新每轮训练的协调标签,具体为:以最低的层次作为最初的训练批次,其余层次按照由低到高的的顺序依次加入,每加入一个层次前训练5轮,根据以下公式更新协调标签:
其中,表示最近5轮各时间段的自身预测,表示最近5轮各时间段的约束后的上下文预测,表示指数平均的权重向量,是最近5轮的各时间段的自身预测的聚合结果,表示最近5轮的各时间段的约束后的上下文预测的聚合结果,
y0表示原始标签,
y
e
表示第
e
轮更新后的协调标签,
η
为动态加权因子,用于调整标签更新的程度;
Rescale(.)
为对矩阵进行按行归一化函数
。6.
根据权利要求1所述的基于一致性学习的模糊分段时间序列分类方法,其特征在于,所述的编码器模块包括
CNN
网络
、CT1
网络
、
均值池化层
、CT2
网络;所述的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。