针对特征过少地区冰雹强度的长时间序列预测方法技术

技术编号：38652326 阅读：13 留言：0更新日期：2023-09-02 22:40

本发明专利技术提出一种针对特征过少地区冰雹强度的长时间序列预测方法，用于解决传统时间序列预测模型因为输入数据和特征越少，而产生的冗余信息和过度拟合，并且输入数据过长导致训练时间复杂度、空间复杂度以及内存使用量过大的问题，针对informer模型进行改进，提出一种应用于气象领域的长时间序列预测模型。通过利用基于MPD的多粒度注意力机制以及SPH机制，修剪消除头中的冗余信息，并且利用ProbSparse自我注意力机制以及自我蒸馏操作减少编码器中的时间复杂度、空间复杂度以及内存使用量，对预测时因为输入数据和特征越少，而产生的冗余信息和过度拟合进行修正，以提高预测的效率和精确度。精确度。精确度。

全部详细技术资料下载

【技术实现步骤摘要】
针对特征过少地区冰雹强度的长时间序列预测方法

[0001]本专利技术属于时间序列预测
，具体设计涉及一种针对特征过少地区冰雹强度的长时间序列预测方法。

技术介绍

[0002]时间序列预测一直是一个广受关注的问题，已经研究了多年。随着互联网的快速发展，时间序列预测在气象方面的应用得到了广泛的认可。然而，目前气象领域的时间序列预测仅仅局限于短期以及中期，中长期的预测方面还需要我们去探索。
[0003]解决LSTF问题的现有方法是(1)传统的机器学习方法，(2)基于RNN架构的递归神经网络(RNN)方法，以及(3)基于变压器架构的方法。
[0004]然而，尽管变压器架构被广泛采用[1]，[2]，但我们目前缺乏对变压器模型内的信息模式对长期序列预测任务的影响的理解。时序预测任务中的数据相对单一，因为数据在输入到模型中之前仅通过输入嵌入进行处理。奇点的这一特征在多头注意力中被放大，其中头部之间的相互作用仍然知之甚少。基于这个事实，我们将从以下思路出发：(1)增强输入数据特征的表达能力，(2)增强多头注意力的表示能力，(3)降低多个注意力头之间的相似性。下面我们将介绍当前输入数据和多头注意力机制的改进。
[0005]关于数据输入法，根据经验，在具有大量参数的模型中，输入数据和特征越少，就越容易产生冗余信息并导致过拟合[3]。这个问题在变压器结构中尤为突出。例如，来自变压器(BERT)模型[4]的双向编码器表示可以达到0.3B参数，但BERT除了执行嵌入操作(位置嵌入)外，不会进一步处理长输入序列。最...

【技术保护点】

【技术特征摘要】
1.针对特征过少地区冰雹强度的长时间序列预测方法，其特征在于,基于informer模型包含编码器和解码器，对informer模型进行如下改进，编码器的输入端接收目标地区的历史时间序列，编码器包括依次相连的注意力模块、切片模块、蒸馏模块，编码器的输出端与蒸馏模块的输入端相连，解码器的输入端与蒸馏模块的输出端相连；注意力模块接收序列矩阵，将其转换为单头注意力并输出至切片模块；切片模块接收序列矩阵和单头注意力，将其转换为多头注意力并输出至蒸馏模块；蒸馏模块接收序列矩阵对其进行蒸馏获得新序列矩阵，蒸馏模块接收多头注意力，对其修剪注意力头，获得新的多头注意力；将新序列矩阵和新的多头注意力输出至解码器，解码器输出预测序列。2.根据权利要求1所述的针对特征过少地区冰雹强度的长时间序列预测方法，其特征在于,基于所述改进后的informer模型，获取目标地区在历史时间段内的历史冰雹强度数据和历史气象信息数据，构建包含目标地区的历史冰雹强度序列数据以及目标地区的历史气象信息数据的数据集，利用数据集对改进后的informer模型进行训练，得到训练完成的冰雹强度预测模型，具体包括以下步骤：步骤1、获取目标地区在历史时间段内的历史冰雹强度数据和历史气象信息数据，并对其进行预处理和归一化操作，获得目标地区在历史时间段内预设时间间隔的历史冰雹强度时间序列X
t
；对冰雹强度时间序列X
t
进行统一转换，获得目标地区在历史时间段内的冰雹强度序列矩阵其中,t表示每个时间间隔的坐标在时间序列中的位置；步骤2、将冰雹强度序列矩阵输入到注意力模块中，并在ProbSparse自我注意力机制中构建依赖关系，得到单头注意力矩阵Attention(Q,K,V)；步骤3、将冰雹强度序列矩阵和单头注意力矩阵Attention(Q,K,V)输入到切片模块中，通过对冰雹强度序列矩阵进行切片并输入至基于多感知域MPD的多粒度注意力机制，将单头注意力矩阵Attention(Q,K,V)转化为具有不同粒度的多头注意力MultiHead(Q,K,V)；步骤4、将多头注意力MultiHead(Q,K,V)和冰雹强度序列矩阵输入至蒸馏模块中，针对多头注意力MultiHead(Q,K,V)，通过修剪注意力头以消除头部冗余信息，得到新的多头注意力MultiHeadnew(Q,K,V)；对冰雹强度序列矩阵进行蒸馏操作，获得新序列矩阵步骤5、将新的多头注意力MultiHeadnew(Q,K,V)和新序列矩阵输入至解码器中，针对编码器中新的多头注意力MultiHeadnew(Q,K,V)，编码器和解码器的注意力层进行特征交互，将新序列矩阵输入到解码器中的多头注意力层中，同时在解码器中输入由及组成的动态采样序列其中，为编码器输入的后半部分，序列数值为零，解码器使用生成式解码方法，得到目标地区在目标时刻的预测冰雹强度序列Y
t
；步骤6、将目标地区的历史冰雹强度序列数据以及目标地区的历史气象信息数据作为输入，对应的目标地区的未来冰雹强度序列作为输出，利用数据集对待训练冰雹强度预测模型进行训练，得到训练完成的冰雹强度预测模型。
3.根据权利要求1所述的针对特征过少地区冰雹强度的长时间序列预测方法，其特征在于,所述步骤1具体包括以下步骤：首先，获取目标地区在历史时间段内各时刻的历史冰雹强度数据，进而构建目标地区在历史时间段内预设时间间隔的历史冰雹强度时间序列X
t
，其中，为历史时间段内各时刻t下目标地区的第i个冰雹强度特征向量，i∈{1,...,L
x
}，L
x
表示序列X
t
的长度，d
x
表示输入要素尺寸，即每个时间间隔的输入特征维度数，表示t时刻目标地区的冰雹强度数据；基于编码器包括卷积层和全连接层,对冰雹强度时间序列X
t
输入卷积层中；对每个时刻的历史冰雹强度数据进行一维卷积处理，得到特征向量通过全连接层处理每个时间点对应的特征向量所对应的位置信息，对序列进行位置编码；位置编码的公式如下:码的公式如下:其中其中，PE表示被编码的向量，其中t表示坐标在序列中的位置；2j和2j+1表示向量的第2j和2j+1个维度，编码的维度为d_{model}；最后，把2维的坐标序列映射到d_{model}维度，并和位置编码后的向量PE进行相加，得到嵌入位置信息后高维向量的冰雹强度序列矩阵具体的公式如下：4.根据权利要求1所述的针对特征过少地区冰雹强度的长时间序列预测方法，其特征在于,所述步骤2具体包括以下步骤：将冰雹强度序列矩阵输入到编码器中，并将其在ProbSparse自我注意力机制中构建依赖关系：构建依赖关系：其中，Q、K、V在根据目标地区在历史时间段内的冰雹强度序列矩阵得到的多头注意力机制层中分别表示查询、键和值，W为计算权值操作,V值的权重通过查询Q和键K计算得出，在计算出查询Q和键V的权重以后，再计算得到V值的加权和,d指输入的维度；其中，第i个Query的attention系...

【专利技术属性】
技术研发人员：荣欢，岳璐，蒋薇，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人