基于GTN的多元时间序列分类模型及其构建方法技术

技术编号：28980576 阅读：93 留言：0更新日期：2021-06-23 09:27

本发明专利技术涉及一种基于GTN的多元时间序列分类模型及其构建方法，多元时间序列分类模型包括embedding层、Two‑tower Transformer层、gating层、线性层和softmax函数层，gating层根据每个tower的输出，得到每个tower的门控权重，并将得到的门控权重加入到相应tower的输出中，连接成最终的特征向量，线性层将gating层得到的结果维度转换成最终分类结果维度，softmax函数层将线性层的输出映射到[0，1]区间内，使得所有输出值的累加和为1，在最后选取输出结点时，选取概率最大的结点，可以实现更高的分类准确率，为以后的时间序列分类任务开辟了新的思路。

全部详细技术资料下载

【技术实现步骤摘要】
基于GTN的多元时间序列分类模型及其构建方法
本专利技术涉及一种基于GTN的多元时间序列分类模型及其构建方法。
技术介绍
深度学习经过多年的发展与研究，目前主流的神经网络有深度神经网络DNN(DeepNeuralNetwork)、卷积神经网络CNN(ConvolutionalNeuralNetworks)、循环神经网RNN(RecurrentNeuralNetworks)和基于注意力机制的Transformer模型。在大数据时代，数据的类型多种多样，常见的数据类型有视频、图像、时间序列等，而深度学习解决的任务大体上分为分类和预测两种任务。DNN网络其实就是仅由全连接构成的前馈深度神经网络(FullyConnectedFeedForwardNeuralNetworks)，Deep表示他的网络模型具有较多的隐藏层，整体深度较大，且完全由全连接层构成。它适用于大部分分类(Classification)任务，比如数字识别等。但一般的现实场景中很少有那么大的数据量来支持DNN，所以纯粹的全连接网络应用性并不是很强。系统使用的数据集为13个多元时间序列(MultivariantTimeSeries)，其中多数数据集并没有大量的数据，全连接层的训练需要大量的训练数据来进行迭代更新。最重要的是，DNN无法对时间序列上的变化进行建模，然而，样本出现的时间顺序对于自然语言处理、语音识别等时间序列应用非常重要。因此，使用DNN模型并不能很好的完成时间序列上的分类任务。CNN网络是一种使用共享卷积核来对数据进行特征提取的模型...

【技术保护点】
1.一种基于GTN的多元时间序列分类模型的构建方法，其特征在于，包括：/n构建embedding层；/n构建Two-tower Transformer层，所述Two-tower Transformer层包括实现并行处理的时间特征编码器和时间步编码器，所述时间特征编码器用于对时间特征进行编码，所述时间步编码器用于对时间步进行编码；/n构建gating层，所述gating层用于根据每个tower的输出，得到非线性激活，将所述非线性激活处理成对应的向量，接着根据所述向量得到线性关系，然后通过softmax函数得到每个tower的门控权重，最后将得到的门控权重加入到相应tower的输出中，连接成最终的特征向量；/n构建线性层，所述线性层用于将gating层得到的结果维度转换成最终分类结果维度；/n构建softmax函数层，所述softmax函数层用于将线性层的输出映射到[0，1]区间内，使得所有输出值的累加和为1，在最后选取输出结点时，选取概率最大的结点。/n

【技术特征摘要】
1.一种基于GTN的多元时间序列分类模型的构建方法，其特征在于，包括：
构建embedding层；
构建Two-towerTransformer层，所述Two-towerTransformer层包括实现并行处理的时间特征编码器和时间步编码器，所述时间特征编码器用于对时间特征进行编码，所述时间步编码器用于对时间步进行编码；
构建gating层，所述gating层用于根据每个tower的输出，得到非线性激活，将所述非线性激活处理成对应的向量，接着根据所述向量得到线性关系，然后通过softmax函数得到每个tower的门控权重，最后将得到的门控权重加入到相应tower的输出中，连接成最终的特征向量；
构建线性层，所述线性层用于将gating层得到的结果维度转换成最终分类结果维度；
构建softmax函数层，所述softmax函数层用于将线性层的输出映射到[0，1]区间内，使得所有输出值的累加和为1，在最后选取输出结点时，选取概率最大的结点。

2.根据权利要求1所述的基于GTN的多元时间序列分类模型的构建方法，其特征在于，所述构建embedding层，包括：
构建embedding层，通过非线性激活函数，将所述embedding层更改为全连接层来代替线性投影。

3.根据权利要求1所述的基于GTN的多元时间序列分类模型的构建方法，其特征在于，所述时间步编码器中设置有位置编码和mask机制。

4.根据权利要求1所述的基于GTN的多元时间序列分类模型的构建方法，其特征在于，所述将所述非线性激活处理成对应的向量，包括：
得到的非线性激活为C和S，将所述非线性激活进行串联，得到的向量为Concat(C，S)；
所述根据所述向量得到线性关系，包括：
得到的线性关系如下：
h＝W·Concat(C，S)+b
其中，h为所述线性关系，W和b为预设参数；
所述通过softmax函数得到每个tower的门控权重，最后将得到的门控权重加入到相应tower的输出中，连接成最终的特征向量，包括：
将所述线性关系通过softmax函数的计算之后得到每个tower的门控权重为g1和g2，计算公式如下：
g1，g2＝Softmax(h)
所述最终的特征向量的计算公式如下：
y＝Concat(C·g1，S·g2)
其中，y为所述最终的特征向量。

5.根据权利要求1所述的基于GTN的多元时间序列分类模型的构建方法，其特征在于，所述将线性层的输出映射到[0，1]区间内，包括：

其中，zi为第i个节点的输出值，C为输出节点的个数，即分类的类别个数；
通过softmax函数能够将多分类的输...

【专利技术属性】
技术研发人员：刘明皓，宋伟，马思远，任晟歧，焦佳辉，
申请(专利权)人：郑州大学，
类型：发明
国别省市：河南;41

全部详细技术资料下载我是这个专利的主人