【技术实现步骤摘要】
一种基于数据增强的神经网络时间序列分类方法
[0001]本专利技术属于时间序列分类领域,尤其涉及一种基于数据增强的神经网络时间序列分类方法。
技术介绍
[0002]时间序列数据广泛地存在于生产生活中,例如股票的走向趋势、天气的温度、患者的心电图等,分析这些时序数据,并从中挖掘出重要信息对指导人们生产生活具有重大意义。时间序列分类是时间序列问题中比较重要且具有挑战性的任务,传统的时间序列分类方法,往往依靠人工设计特征,计算过程繁琐且时间复杂度高。而基于深度学习的方法,则需要大量的训练数据保证模型的泛化能力,以避免过拟合和欠拟合,这种方法在数据量小的情况下,难以发挥作用。
[0003]目前时间序列分类方法大致可分为基于距离的方法、基于特征的方法和基于深度学习的方法。基于距离的方法以欧氏距离或动态时间规整距离等,使用最近邻分类器以距离关系做分类;基于特征的方法,通过人工设计以形状,频率,统计学参数等作为特征,训练分类模型(如支持向量机、随机森林等);基于深度学习的方法,通过设计神经网络结构,直接输入原始数据训练模型,实现了 ...
【技术保护点】
【技术特征摘要】
1.一种基于数据增强的神经网络时间序列分类方法,其特征在于:包括以下步骤:步骤1:对包含N个样本的时间序列数据集D={(x1,y1),(x2,y2),...,(x
N
,y
N
)}进行预处理;步骤2:对训练集D
train
进行数据增强;步骤3:构建LSTM
‑
FCN模型,LSTM
‑
FCN中有两个并行分支:LSTM和FCN,LSTM由一个LSTM单元组成,隐含状态个数为8,最后是丢弃率为0.8的丢弃层;FCN由3个一维卷积层组成,分别具有{7
×
1,5
×
1,3
×
1}的卷积核和{128,256,128}个通道,卷积步长均为1,每个卷积层后都有一个块归一化层和修正线性单元,FCN的最后一层为全局平均池化层;对于第i个输入时间序列样本,LSTM
‑
FCN首先分别使用LSTM和FCN提取特征f
LSTM
和f
FCN
,然后将特征f
LSTM
、f
FCN
在特征维度上进行拼接,最后使用Softmax对拼接的特征进行分类;步骤4:选择迭代次数、学习率参数,每次迭代按照生成训练集D
mixup
训练LSTM
‑
FCN模型,以交叉熵函数作为损失函数,使用反向传播和梯度下降算法Adam训练网络,并保存训练好的网络,交叉熵函数公式为:其中,为时间序列真实标签,为时间序列预测标签,1≤p≤N
train
;步骤5:在测试集D
test
上测试训练好的LSTM
‑
FCN网络,计算时间序列的分类准确率。2.根据权利要求1所述的一种基于数据增强的神经网络时间序列分类方法,其特征在于:预处理步骤包括:步骤1.1:使用z
‑
score标准化方法对时间序列数据集D进行标准化处理,标准化公式为:其中,x
i
表示第i个时间序列样本,μ表示时间序列样本均值,σ表示时间序列样本方差,x
i
′
表示标准化后的第i个时间序列样本,1≤i≤N;步骤1.2:将时间序列样本类别标签y
i
转换为独热编码y
′
i
,其中,y
′
i
为具有C个元素的一维向量,C为时间序列样本类别数量,转换公式为:其中,j∈[0,C),且j属于整数;步骤1.3...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。