一种基于数据增强的神经网络时间序列分类方法技术

技术编号:29043749 阅读:76 留言:0更新日期:2021-06-26 05:54
本发明专利技术公开了一种基于数据增强的神经网络时间序列分类方法,首先,对时间序列数据集进行预处理;其次,选择合适的参数α对训练数据进行Mixup数据增强,增强后的数据用于模型训练;接着,构建LSTM

【技术实现步骤摘要】
一种基于数据增强的神经网络时间序列分类方法


[0001]本专利技术属于时间序列分类领域,尤其涉及一种基于数据增强的神经网络时间序列分类方法。

技术介绍

[0002]时间序列数据广泛地存在于生产生活中,例如股票的走向趋势、天气的温度、患者的心电图等,分析这些时序数据,并从中挖掘出重要信息对指导人们生产生活具有重大意义。时间序列分类是时间序列问题中比较重要且具有挑战性的任务,传统的时间序列分类方法,往往依靠人工设计特征,计算过程繁琐且时间复杂度高。而基于深度学习的方法,则需要大量的训练数据保证模型的泛化能力,以避免过拟合和欠拟合,这种方法在数据量小的情况下,难以发挥作用。
[0003]目前时间序列分类方法大致可分为基于距离的方法、基于特征的方法和基于深度学习的方法。基于距离的方法以欧氏距离或动态时间规整距离等,使用最近邻分类器以距离关系做分类;基于特征的方法,通过人工设计以形状,频率,统计学参数等作为特征,训练分类模型(如支持向量机、随机森林等);基于深度学习的方法,通过设计神经网络结构,直接输入原始数据训练模型,实现了端到端的训练过程。为本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于数据增强的神经网络时间序列分类方法,其特征在于:包括以下步骤:步骤1:对包含N个样本的时间序列数据集D={(x1,y1),(x2,y2),...,(x
N
,y
N
)}进行预处理;步骤2:对训练集D
train
进行数据增强;步骤3:构建LSTM

FCN模型,LSTM

FCN中有两个并行分支:LSTM和FCN,LSTM由一个LSTM单元组成,隐含状态个数为8,最后是丢弃率为0.8的丢弃层;FCN由3个一维卷积层组成,分别具有{7
×
1,5
×
1,3
×
1}的卷积核和{128,256,128}个通道,卷积步长均为1,每个卷积层后都有一个块归一化层和修正线性单元,FCN的最后一层为全局平均池化层;对于第i个输入时间序列样本,LSTM

FCN首先分别使用LSTM和FCN提取特征f
LSTM
和f
FCN
,然后将特征f
LSTM
、f
FCN
在特征维度上进行拼接,最后使用Softmax对拼接的特征进行分类;步骤4:选择迭代次数、学习率参数,每次迭代按照生成训练集D
mixup
训练LSTM

FCN模型,以交叉熵函数作为损失函数,使用反向传播和梯度下降算法Adam训练网络,并保存训练好的网络,交叉熵函数公式为:其中,为时间序列真实标签,为时间序列预测标签,1≤p≤N
train
;步骤5:在测试集D
test
上测试训练好的LSTM

FCN网络,计算时间序列的分类准确率。2.根据权利要求1所述的一种基于数据增强的神经网络时间序列分类方法,其特征在于:预处理步骤包括:步骤1.1:使用z

score标准化方法对时间序列数据集D进行标准化处理,标准化公式为:其中,x
i
表示第i个时间序列样本,μ表示时间序列样本均值,σ表示时间序列样本方差,x
i

表示标准化后的第i个时间序列样本,1≤i≤N;步骤1.2:将时间序列样本类别标签y
i
转换为独热编码y

i
,其中,y

i
为具有C个元素的一维向量,C为时间序列样本类别数量,转换公式为:其中,j∈[0,C),且j属于整数;步骤1.3...

【专利技术属性】
技术研发人员:王天张婷刘兆英李玉鑑
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1