序列预测模型训练方法、装置及计算机可读介质制造方法及图纸

技术编号：36753681 阅读：56 留言：0更新日期：2023-03-04 10:42

本发明专利技术提供了一种序列预测模型训练方法、装置及计算机可读介质，在采集数据集并对所述数据集进行归一化处理后生成时间序列数据样本后，基于膨胀系数、平移量和调整参数构造基于神经网络的区间二型激活函数，接着根据时间序列数据样本和二型激活函数计算出输入层、隐藏层和输出层的输入和输出，并计算输出的误差，然后计算二型激活函数后的最终导数后，计算输入层、隐藏层和输出层的误差信号，最后基于误差信号对输入层、隐藏层和输出层的权重进行更新，并在所述权重达到预设精度时，输出序列预测模型。通过发明专利技术训练方法得到序列预测模型具有更好的泛化能力、稳定性和抗干扰能力，提高了在后续序列预测的效率和整体性能。提高了在后续序列预测的效率和整体性能。提高了在后续序列预测的效率和整体性能。

全部详细技术资料下载

【技术实现步骤摘要】
序列预测模型训练方法、装置及计算机可读介质

[0001]本专利技术涉及数据处理
，尤其涉及一种序列预测模型训练方法、装置及计算机可读介质。

技术介绍

[0002]在经典误差反向传播算法中，由于sigmoid激活函数的导数值总是小于1，并且在从输出层到底层的反向传播过程中，残差值每经过一个隐藏层就乘上导数值，经过多层处理后，神经元进入激活函数的饱和区，深度神经网络会因为底层残差太小而无法得到有效训练。从而会使得训练得到序列预测模型泛化能力、稳定性和抗干扰能力较差，从而影响序列预测的整体性能。

技术实现思路

[0003]有鉴于此，本专利技术实施例提供了一种序列预测模型训练方法。该方法包括：
[0004]S1、采集数据集并对所述数据集进行归一化处理后生成时间序列数据样本；
[0005]S2、基于膨胀系数、平移量和调整参数构造基于神经网络的区间二型激活函数；
[0006]S3、根据时间序列数据样本和二型激活函数计算出输入层、隐藏层和输出层的输入和输出，并计算输出的误差；
[0007]S4、计算二型激活函数后的最终导数后，计算输入层、隐藏层和输出层的误差信号；
[0008]S5、基于误差信号对输入层、隐藏层和输出层的权重进行更新，并在所述权重达到预设精度时，输出序列预测模型。
[0009]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述S1具体包括：
[0010]将数据集的每个数据映射到0
‑
1内得出时间...

【技术保护点】

【技术特征摘要】
1.一种序列预测模型训练方法，其特征在于，所述方法包括：S1、采集数据集并对所述数据集进行归一化处理后生成时间序列数据样本；S2、基于膨胀系数、平移量和调整参数构造基于神经网络的区间二型激活函数；S3、根据时间序列数据样本和二型激活函数计算出输入层、隐藏层和输出层的输入和输出，并计算输出的误差；S4、计算二型激活函数后的最终导数后，计算输入层、隐藏层和输出层的误差信号；S5、基于误差信号对输入层、隐藏层和输出层的权重进行更新，并在所述权重达到预设精度时，输出序列预测模型。2.根据权利要求1所述的序列预测模型训练方法，其特征在于，所述S1具体包括：将数据集的每个数据映射到0
‑
1内得出时间序列数据样本，归一化公式如下：x
i
为每行样本中的任一数据，x
max
为每行样本中的最大值，x
min
为每行样本中的最小值。3.根据权利要求2所述的序列预测模型训练方法，其特征在于，所述S2具体包括：S21、定义膨胀系数α、平移量β，以及调整导数值的参数λ；S22、区间二型激活函数的上隶属函数、下隶属函数和中间隶属函数通过如下公式进行计算：S23、区间二型激活函数的上导数、下导数和中间导数通过如下公式进行计算：S24、区间二型激活函数的输出层残差通过公式进行计算，其他层残差通过公式进行计算；其中，O
Au
(z)是上隶属函数，O
Al
(z)是下隶属函数，O
Am
(z)是中间隶属函数，z是上隶属函数和下隶属函数的输入值；是上导数，是下导数，是中间导数；W表示权重，l表示层数，O
′
A
(z
l
)表示激活函数的导数值，n
l
表示第l层的属性数量。4.根据权利要求3所述的序列预测模型训练方法其特征在于，所述S3具体包括：
S31、输入时间序列数据样本(x
i
,y
i
)，通过公式计算输入层和隐藏层的每个层的输入和输出；以及，通过公式计算输出层的输出；S32、通过公式计算输出误差；其中，i＝1,
…
,m，表示输出层的输出，m表示输入的样本数量，k表示期望值所拥有的属性数，y
k
表示期望值的不同属性下的值。5.根据权利要求4所述的序列预测模型训...

【专利技术属性】
技术研发人员：胡佳乐，赵国亮，黄沙日娜，
申请(专利权)人：内蒙古大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人