当前位置: 首页 > 专利查询>重庆大学专利>正文

深度残差LSTM网络及热误差预测模型的建模方法和迁移学习方法技术

技术编号:30547513 阅读:12 留言:0更新日期:2021-10-30 13:26
本发明专利技术公开了一种深度残差LSTM网络,其特征在于:包括依次设置的:输入层;卷积层;池化层;重塑层;LSTM层;Dense层;输出层;所述LSTM层与密集层之间设有n个预激活残差块,且n≥1;所述预激活残差块包括依次设置的第一BN层、第一权重层、第一卷积层、第二BN层、第二权重层和第二卷积层;所述第一BN层和第二BN层用于解决网络无法收敛的问题;所述第一权重层和第二权重层用于提取特征;所述第一BN层与第一权重层之间以及第二BN层与第二权重层之间分别具有用于减少参数之间的相互依赖的激活函数。本发明专利技术还公开了一种热误差预测模型的建模方法及迁移学习方法。本发明专利技术能够避免网络深度增加导致的预测精度饱和问题,能够有效提高预测精度和鲁棒性。和鲁棒性。和鲁棒性。

【技术实现步骤摘要】
深度残差LSTM网络及热误差预测模型的建模方法和迁移学习方法


[0001]本专利技术属于机械误差分析
,具体的为一种深度残差LSTM网络及热误差预测模型的建模方法和迁移学习方法。

技术介绍

[0002]精密机床作为实现复杂零件高精度加工的关键设备,在航空、航天、核电等领域得到广泛应用。但热误差会显着降低机床的加工精度。已经证明,热误差是总误差的主要部分。因此,减少或避免热误差对于保证加工零件的几何误差极为重要。不平衡的温度场是热误差的主要原因。内部和外部热源导致温度场不平衡。内部热源包括伺服电机、轴承、滚珠丝杠、滚动导轨等,但不限于这些热源。滚动功能部件,包括轴承、滚珠丝杠和滚动导轨以及伺服电机也会导致温度升高。工作条件对内部热源有直接影响,环境温度、阳光和人类也随着时间的推移而不同,因此动态热误差具有时变和非线性效应。
[0003]基于机理的误差模型能够反映产生热误差的根本原因,但是基于机理的误差模型不够灵活和准确,不足以显示机床的热行为,因为边界条件难以准确确定。基于数据的误差建模和控制方法具有当前机器学习和深度学习方法的优势,与基于机理的模型相比,基于数据的误差模型更加灵活,使用起来更加方便。以前的研究将临界温度视为基于数据的模型的输入,聚类方法用于选择临界温度,但不能完全消除温度之间的共线性,导致鲁棒性下降。而且,传统模型的预测精度不够高,因为误差模型没有自学习和自更新能力。此外,经验相关性和基于数据的误差模型不能准确反映误差机理。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种深度残差LSTM网络及热误差预测模型的建模方法和迁移学习方法,能够避免网络深度增加导致的预测精度饱和问题,能够有效提高预测精度和鲁棒性。
[0005]为达到上述目的,本专利技术提供如下技术方案:
[0006]本专利技术首先提出了一种深度残差LSTM网络,其特征在于:包括依次设置的:
[0007]输入层;
[0008]卷积层:利用多个不同的卷积核得到多个特征向量来实现特征降维;
[0009]池化层:用于减少每一层训练所涉及的参数数量;
[0010]重塑层:重新排列某个维度的多维矩阵,并构造一个元素数相同但维度不同的新矩阵;
[0011]LSTM层:用于表征热误差的长期和非线性记忆行为;
[0012]Dense层;
[0013]输出层;
[0014]所述LSTM层与密集层之间设有n个预激活残差块,且n≥1;所述预激活残差块包括
依次设置的第一BN层、第一权重层、第一卷积层、第二BN层、第二权重层和第二卷积层;所述第一BN层和第二BN层用于解决网络无法收敛的问题;所述第一权重层和第二权重层用于提取特征;所述第一BN层与第一权重层之间以及第二BN层与第二权重层之间分别具有用于减少参数之间的相互依赖的激活函数。
[0015]进一步,所述预激活残差块的残差结构可表示为:
[0016][0017]其中,x0表示输入;W
i
表示与第i
th
个残差单元相关的权重;x
m
表示任意深度层m的特征。进一步,所述激活函数采用ReLU函数,并可表示为:
[0018]ReLU(x)=max(0,x)。
[0019]本专利技术还提出了一种热误差预测模型的建模方法,包括如下步骤:
[0020]1)对原始热误差数据进行预处理;
[0021]2)随机生成斑鬣狗种群,判断斑鬣狗种群的初始位置是否超出预设范围;若是,则将斑鬣狗种群的初始位置更改为边界;若否,则保持斑鬣狗种群的位置;
[0022]3)建立如上所述的深度残差LSTM网络;
[0023]4)将斑鬣狗的位置映射为深度残差LSTM网络的batch size和epoch size;
[0024]5)将预处理后的热误差数据输入深度残差LSTM网络,以MAE(平均绝对误差)作为斑鬣狗优化算法的适应度,通过深度残差LSTM网络的训练和预测得到MAE的值;
[0025]6)判断MAE是否满足预设要求;若是,则执行步骤8);若否,则以斑鬣狗优化算法更新斑鬣狗种群的位置,若更新后的适应度小于更新前的最优适应度,则以搜索到斑鬣狗位置X
t+1
替换更新前的最优的斑鬣狗位置X
*

[0026]7)判断迭代次数是否达到最大值,若是,则终止迭代,得到最佳解;若否,则令t=t+1,循环步骤4)和步骤7);
[0027]8)输出MAE,以优化得到的斑鬣狗位置映射的batch size和epoch size作为深度残差LSTM网络的超参数。
[0028]进一步,所述步骤1)中,采用ILMS过滤算法对原始热误差数据进行预处理,且ILMS过滤算法的滤波器估计得到的输出表示为:
[0029][0030]其中,X(n)表示状态向量,且X(n)=[x(n),x(n

1),

,x(n

M+1)]T
;W
T
(n)表示权重向量W(n)的转置矩阵,且W(n)=[w(n),w(n

1),

,w(n

M+1)]T
;x(n)和y(n)分别表示输入和输出;M表示最大迭代次数;w(n)表示权重系数;a为系数,且a≥1;
[0031]其中,权重系数的更新为:
[0032]w(n+1)=w(n)+μ(n)e(n)x(n)
[0033]e(n)为估计误差,且:
[0034]e(n)=d(n)

y(n)
[0035]其中,d(n)表示n时刻的期望响应;μ(n)为非线性可变步长;
[0036][0037]其中,c表示控制函数形状的常数;β表示控制函数范围的常量。
[0038]进一步,所述步骤2)中,采用混沌伯努利映射生成斑鬣狗种群的初始位置,并使斑鬣狗在搜索空间中均匀分布,其中,混沌伯努利映射表示为:
[0039][0040]其中,λ=0.4;z0=0.152;
[0041]通过伯努利位移变换,得到:
[0042]z
k+1
=z
k mod1
[0043]其中,z
k
表示第k个斑鬣狗;z
k+1
表示表示第k+1个斑鬣狗;λ为0.5。
[0044]进一步,所述斑鬣狗优化算法包括包围过程、狩猎过程和攻击过程三种行为;其中,包围过程为:
[0045]D
h
=|B
·
P
p
(x)

P(x)|
[0046]P(x+1)=P
p
(x)

E
·
D
h
[0047]其中,D
h
表示斑鬣狗与其猎物之间的距离;x表示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种深度残差LSTM网络,其特征在于:包括依次设置的:输入层;卷积层:利用多个不同的卷积核得到多个特征向量来实现特征降维;池化层:用于减少每一层训练所涉及的参数数量;重塑层:重新排列某个维度的多维矩阵,并构造一个元素数相同但维度不同的新矩阵;LSTM层:用于表征热误差的长期和非线性记忆行为;Dense层;输出层;所述LSTM层与密集层之间设有n个预激活残差块,且n≥1;所述预激活残差块包括依次设置的第一BN层、第一权重层、第一卷积层、第二BN层、第二权重层和第二卷积层;所述第一BN层和第二BN层用于解决网络无法收敛的问题;所述第一权重层和第二权重层用于提取特征;所述第一BN层与第一权重层之间以及第二BN层与第二权重层之间分别具有用于减少参数之间的相互依赖的激活函数。2.根据权利要求1所述的深度残差LSTM网络,其特征在于:所述预激活残差块的残差结构可表示为:其中,x0表示输入;W
i
表示与第i
th
个残差单元相关的权重;x
m
表示任意深度层m的特征。3.根据权利要求1所述的深度残差LSTM网络,其特征在于:所述激活函数采用ReLU函数,并可表示为:ReLU(x)=max(0,x)。4.一种热误差预测模型的建模方法,其特征在于:包括如下步骤:1)对原始热误差数据进行预处理;2)随机生成斑鬣狗种群,判断斑鬣狗种群的初始位置是否超出预设范围;若是,则将斑鬣狗种群的初始位置更改为边界;若否,则保持斑鬣狗种群的位置;3)建立如权利要求1

3任一项所述的深度残差LSTM网络;4)将斑鬣狗的位置映射为深度残差LSTM网络的batch size和epoch size;5)将预处理后的热误差数据输入深度残差LSTM网络,以MAE(平均绝对误差)作为斑鬣狗优化算法的适应度,通过深度残差LSTM网络的训练和预测得到MAE的值;6)判断MAE是否满足预设要求;若是,则执行步骤8);若否,则以斑鬣狗优化算法更新斑鬣狗种群的位置,若更新后的适应度小于更新前的最优适应度,则以搜索到斑鬣狗位置X
t+1
替换更新前的最优的斑鬣狗位置X
*
;7)判断迭代次数是否达到最大值,若是,则终止迭代,得到最佳解;若否,则令t=t+1,循环步骤4)和步骤7);8)输出MAE,以优化得到的斑鬣狗位置映射的batch size和epoch size作为深度残差LSTM网络的超参数。5.根据权利要求4所述热误差预测模型的建模方法,其特征在于:所述步骤1)中,采用ILMS过滤算法对原始热误差数据进行预处理,且ILMS过滤算法的滤波器估计得到的输出表示为:
其中,X(n)表示状态向量,且X(n)=[x(n),x(n

1),

,x(n

M+1)]
T
;W
T
(n)表示权重向量W(n)的转置矩阵,且W(n)=[w(n),w(n

1),

,w(n

M+1)]
T...

【专利技术属性】
技术研发人员:马驰刘佳兰桂洪泉王时龙
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1