当前位置: 首页 > 专利查询>内蒙古大学专利>正文

序列预测模型训练方法、装置及计算机可读介质制造方法及图纸

技术编号:36753681 阅读:56 留言:0更新日期:2023-03-04 10:42
本发明专利技术提供了一种序列预测模型训练方法、装置及计算机可读介质,在采集数据集并对所述数据集进行归一化处理后生成时间序列数据样本后,基于膨胀系数、平移量和调整参数构造基于神经网络的区间二型激活函数,接着根据时间序列数据样本和二型激活函数计算出输入层、隐藏层和输出层的输入和输出,并计算输出的误差,然后计算二型激活函数后的最终导数后,计算输入层、隐藏层和输出层的误差信号,最后基于误差信号对输入层、隐藏层和输出层的权重进行更新,并在所述权重达到预设精度时,输出序列预测模型。通过发明专利技术训练方法得到序列预测模型具有更好的泛化能力、稳定性和抗干扰能力,提高了在后续序列预测的效率和整体性能。提高了在后续序列预测的效率和整体性能。提高了在后续序列预测的效率和整体性能。

【技术实现步骤摘要】
序列预测模型训练方法、装置及计算机可读介质


[0001]本专利技术涉及数据处理
,尤其涉及一种序列预测模型训练方法、装置及计算机可读介质。

技术介绍

[0002]在经典误差反向传播算法中,由于sigmoid激活函数的导数值总是小于1,并且在从输出层到底层的反向传播过程中,残差值每经过一个隐藏层就乘上导数值,经过多层处理后,神经元进入激活函数的饱和区,深度神经网络会因为底层残差太小而无法得到有效训练。从而会使得训练得到序列预测模型泛化能力、稳定性和抗干扰能力较差,从而影响序列预测的整体性能。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供了一种序列预测模型训练方法。该方法包括:
[0004]S1、采集数据集并对所述数据集进行归一化处理后生成时间序列数据样本;
[0005]S2、基于膨胀系数、平移量和调整参数构造基于神经网络的区间二型激活函数;
[0006]S3、根据时间序列数据样本和二型激活函数计算出输入层、隐藏层和输出层的输入和输出,并计算输出的误差;
[0007]S4、计算二型激活函数后的最终导数后,计算输入层、隐藏层和输出层的误差信号;
[0008]S5、基于误差信号对输入层、隐藏层和输出层的权重进行更新,并在所述权重达到预设精度时,输出序列预测模型。
[0009]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S1具体包括:
[0010]将数据集的每个数据映射到0

1内得出时间序列数据样本,归一化公式如下:x
i
为每行样本中的任一数据,x
max
为每行样本中的最大值,x
min
为每行样本中的最小值。
[0011]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S2具体包括:
[0012]S21、定义膨胀系数α、平移量β,以及调整导数值的参数λ;
[0013]S22、区间二型激活函数的上隶属函数、下隶属函数和中间隶属函数通过如下公式进行计算:
[0014]O
Au
(z)=f(α(z+β))=(1+e

α(z+β)
)
‑1[0015]O
Al
(z)=f(α(z

β))=(1+e

α(z

β)
)
‑1;
[0016][0017]S23、区间二型激活函数的上导数、下导数和中间导数通过如下公式进行计算:
[0018][0019]S24、区间二型激活函数的输出层残差通过公式δ
(nl)


λα(y

T)
·
O

A
(z
l
)进行计算,其他层残差通过公式进行计算;
[0020]其中,O
Au
(z)是上隶属函数,O
Al
(z)是下隶属函数,O
Am
(z)是中间隶属函数,z是上隶属函数和下隶属函数的输入值;是上导数,是下导数,是中间导数;W表示权重,l表示层数,O

A
(z
l
)表示激活函数的导数值,n
l
表示第l层的属性数量。
[0021]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S3具体包括:
[0022]S31、输入时间序列数据样本(x
i
,y
i
),通过公式计算输入层和隐藏层的每个层的输入和输出;以及,通过公式计算输出层的输出;
[0023]S32、通过公式计算输出误差;
[0024]其中,i=1,

,m,表示输出层的输出,m表示输入的样本数量,k表示期望值所拥有的属性数,y
k
表示期望值的不同属性下的值。
[0025]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S4具体包括:
[0026]S41、基于区间二型激活函数的上导数值、下导数值和中间导数值,以及上隶属函数值、下隶属函数值和中间隶属函数值,形成三种三阶张量:
[0027][0028]S42、在三种三阶张量中,以中间张量为主,上张量和下张量为辅通过公式H=M.*U.*(1./L)构造新的三阶张量H;
[0029]S43、通过公式将三阶张量H降维后生成区间二型激活函数的最终导数;
[0030]其中,U
(:,1,:)
和U
(:,2,:)
为上张量,分别由上导数和上隶属度重塑而成,这两个张量可以堆叠为张量U;L
(:,1,:)
和L
(:,2,:)
为下张量,分别由下导数和下隶属度重塑而成,这两个张量可以堆叠为张量L;M
(:,1,:)
和M
(:,2,:)
为中间张量,分别由中间导数和中间隶属度重塑而成,这两个张量可以堆叠为张量M;c表示当前隐藏层的神经元个数。
[0031]如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S5具体包括:
[0032]通过W
l
=W
l

ηz
l
δ
(l+1)
对每层的权重不断进行更新,当权重达到预设精度时,停止更新,并输出序列预测模型。
[0033]第二方面,本专利技术实施例提供了一种序列预测模型训练装置。所述装置包括:
[0034]采集单元,用于采集数据集并对所述数据集进行归一化处理后生成时间序列数据样本;
[0035]构造单元,用于基于膨胀系数、平移量和调整参数构造基于神经网络的区间二型激活函数;
[0036]第一计算单元,用于根据时间序列数据样本和二型激活函数计算出输入层、隐藏层和输出层的输入和输出,并计算输出的误差;
[0037]第二计算单元,用于计算二型激活函数后的最终导数后,计算输入层、隐藏层和输出层的误差信号;
[0038]更新单元,用于基于误差信号对输入层、隐藏层和输出层的权重进行更新,并在所述权重达到预设精度时,输出序列预测模型。
[0039]该序列预测模型训练装置包括至少一个处理器和存储器,所述至少一个处理器与所述存储器耦合,用于读取并执行所述存储器中的指令,以执行本专利技术实施例提供的序列预测模型训练方法。
[0040]第二方面,本专利技术实施例提供了一种计算机可读介质。所述计算机可读介质存储有程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行本专利技术实施例提
供的序列预测模型训练方法。
[0041]上述技术方案中的一个技术方案具有如下有益效果:
[0042]本专利技术提供了一种序列预测模型训练方法,在采集数据集并对所述数据集进行归一化处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种序列预测模型训练方法,其特征在于,所述方法包括:S1、采集数据集并对所述数据集进行归一化处理后生成时间序列数据样本;S2、基于膨胀系数、平移量和调整参数构造基于神经网络的区间二型激活函数;S3、根据时间序列数据样本和二型激活函数计算出输入层、隐藏层和输出层的输入和输出,并计算输出的误差;S4、计算二型激活函数后的最终导数后,计算输入层、隐藏层和输出层的误差信号;S5、基于误差信号对输入层、隐藏层和输出层的权重进行更新,并在所述权重达到预设精度时,输出序列预测模型。2.根据权利要求1所述的序列预测模型训练方法,其特征在于,所述S1具体包括:将数据集的每个数据映射到0

1内得出时间序列数据样本,归一化公式如下:x
i
为每行样本中的任一数据,x
max
为每行样本中的最大值,x
min
为每行样本中的最小值。3.根据权利要求2所述的序列预测模型训练方法,其特征在于,所述S2具体包括:S21、定义膨胀系数α、平移量β,以及调整导数值的参数λ;S22、区间二型激活函数的上隶属函数、下隶属函数和中间隶属函数通过如下公式进行计算:S23、区间二型激活函数的上导数、下导数和中间导数通过如下公式进行计算:S24、区间二型激活函数的输出层残差通过公式进行计算,其他层残差通过公式进行计算;其中,O
Au
(z)是上隶属函数,O
Al
(z)是下隶属函数,O
Am
(z)是中间隶属函数,z是上隶属函数和下隶属函数的输入值;是上导数,是下导数,是中间导数;W表示权重,l表示层数,O

A
(z
l
)表示激活函数的导数值,n
l
表示第l层的属性数量。4.根据权利要求3所述的序列预测模型训练方法其特征在于,所述S3具体包括:
S31、输入时间序列数据样本(x
i
,y
i
),通过公式计算输入层和隐藏层的每个层的输入和输出;以及,通过公式计算输出层的输出;S32、通过公式计算输出误差;其中,i=1,

,m,表示输出层的输出,m表示输入的样本数量,k表示期望值所拥有的属性数,y
k
表示期望值的不同属性下的值。5.根据权利要求4所述的序列预测模型训...

【专利技术属性】
技术研发人员:胡佳乐赵国亮黄沙日娜
申请(专利权)人:内蒙古大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1