【技术实现步骤摘要】
基于GTN的多元时间序列分类模型及其构建方法
本专利技术涉及一种基于GTN的多元时间序列分类模型及其构建方法。
技术介绍
深度学习经过多年的发展与研究,目前主流的神经网络有深度神经网络DNN(DeepNeuralNetwork)、卷积神经网络CNN(ConvolutionalNeuralNetworks)、循环神经网RNN(RecurrentNeuralNetworks)和基于注意力机制的Transformer模型。在大数据时代,数据的类型多种多样,常见的数据类型有视频、图像、时间序列等,而深度学习解决的任务大体上分为分类和预测两种任务。DNN网络其实就是仅由全连接构成的前馈深度神经网络(FullyConnectedFeedForwardNeuralNetworks),Deep表示他的网络模型具有较多的隐藏层,整体深度较大,且完全由全连接层构成。它适用于大部分分类(Classification)任务,比如数字识别等。但一般的现实场景中很少有那么大的数据量来支持DNN,所以纯粹的全连接网络应用性并不是很强。系统使用的数据集为13个多元时间序列(MultivariantTimeSeries),其中多数数据集并没有大量的数据,全连接层的训练需要大量的训练数据来进行迭代更新。最重要的是,DNN无法对时间序列上的变化进行建模,然而,样本出现的时间顺序对于自然语言处理、语音识别等时间序列应用非常重要。因此,使用DNN模型并不能很好的完成时间序列上的分类任务。CNN网络是一种使用共享卷积核来对数据进行特征提取的模型 ...
【技术保护点】
1.一种基于GTN的多元时间序列分类模型的构建方法,其特征在于,包括:/n构建embedding层;/n构建Two-tower Transformer层,所述Two-tower Transformer层包括实现并行处理的时间特征编码器和时间步编码器,所述时间特征编码器用于对时间特征进行编码,所述时间步编码器用于对时间步进行编码;/n构建gating层,所述gating层用于根据每个tower的输出,得到非线性激活,将所述非线性激活处理成对应的向量,接着根据所述向量得到线性关系,然后通过softmax函数得到每个tower的门控权重,最后将得到的门控权重加入到相应tower的输出中,连接成最终的特征向量;/n构建线性层,所述线性层用于将gating层得到的结果维度转换成最终分类结果维度;/n构建softmax函数层,所述softmax函数层用于将线性层的输出映射到[0,1]区间内,使得所有输出值的累加和为1,在最后选取输出结点时,选取概率最大的结点。/n
【技术特征摘要】
1.一种基于GTN的多元时间序列分类模型的构建方法,其特征在于,包括:
构建embedding层;
构建Two-towerTransformer层,所述Two-towerTransformer层包括实现并行处理的时间特征编码器和时间步编码器,所述时间特征编码器用于对时间特征进行编码,所述时间步编码器用于对时间步进行编码;
构建gating层,所述gating层用于根据每个tower的输出,得到非线性激活,将所述非线性激活处理成对应的向量,接着根据所述向量得到线性关系,然后通过softmax函数得到每个tower的门控权重,最后将得到的门控权重加入到相应tower的输出中,连接成最终的特征向量;
构建线性层,所述线性层用于将gating层得到的结果维度转换成最终分类结果维度;
构建softmax函数层,所述softmax函数层用于将线性层的输出映射到[0,1]区间内,使得所有输出值的累加和为1,在最后选取输出结点时,选取概率最大的结点。
2.根据权利要求1所述的基于GTN的多元时间序列分类模型的构建方法,其特征在于,所述构建embedding层,包括:
构建embedding层,通过非线性激活函数,将所述embedding层更改为全连接层来代替线性投影。
3.根据权利要求1所述的基于GTN的多元时间序列分类模型的构建方法,其特征在于,所述时间步编码器中设置有位置编码和mask机制。
4.根据权利要求1所述的基于GTN的多元时间序列分类模型的构建方法,其特征在于,所述将所述非线性激活处理成对应的向量,包括:
得到的非线性激活为C和S,将所述非线性激活进行串联,得到的向量为Concat(C,S);
所述根据所述向量得到线性关系,包括:
得到的线性关系如下:
h=W·Concat(C,S)+b
其中,h为所述线性关系,W和b为预设参数;
所述通过softmax函数得到每个tower的门控权重,最后将得到的门控权重加入到相应tower的输出中,连接成最终的特征向量,包括:
将所述线性关系通过softmax函数的计算之后得到每个tower的门控权重为g1和g2,计算公式如下:
g1,g2=Softmax(h)
所述最终的特征向量的计算公式如下:
y=Concat(C·g1,S·g2)
其中,y为所述最终的特征向量。
5.根据权利要求1所述的基于GTN的多元时间序列分类模型的构建方法,其特征在于,所述将线性层的输出映射到[0,1]区间内,包括:
其中,zi为第i个节点的输出值,C为输出节点的个数,即分类的类别个数;
通过softmax函数能够将多分类的输...
【专利技术属性】
技术研发人员:刘明皓,宋伟,马思远,任晟歧,焦佳辉,
申请(专利权)人:郑州大学,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。