基于知识蒸馏的曲轴内部缺陷检测方法及检测设备技术

技术编号:34082609 阅读:22 留言:0更新日期:2022-07-11 19:14
本发明专利技术公开了一种基于知识蒸馏的曲轴内部缺陷检测方法及检测设备,检测方法包括:采集曲轴正常状态和缺陷状态下的激振信号,将激振信号变换得到时域数据、频域数据及时频域数据,构建振动数据集;构建教师模型

【技术实现步骤摘要】
基于知识蒸馏的曲轴内部缺陷检测方法及检测设备


[0001]本专利技术涉及曲轴的缺陷检测
,特别是涉及一种基于知识蒸馏的曲轴内部缺陷检测方法及检测设备。

技术介绍

[0002]曲轴是发动机的核心零部件,主要用于发动机的功率输出。曲轴缺陷,如肩裂纹、弯曲、轴颈磨损、烧伤以及内部缺陷,直接影响发动机的使用性能和寿命,而诸如表面裂纹、弯曲和磨损可以通过机器视觉的技术进行检测。由于内部缺陷形态各异、位置不定、尺寸不一,利用传统的声发设备进行检测,具有成本高的缺点。因而研究基于振动信号来检测曲轴内部缺陷对曲轴制造工业具有十分重要的意义。近年来,随着深度学习技术的发展,利用基于时间序列信号的深度学习方法来检测机器领部件的故障,通过神经网络提取信号中隐藏的缺陷信息来预测缺陷已成为缺陷检测领域的重要形式。
[0003]然而,在相关技术中,大多采用振动信号中的时域、频域或时频域中的一种数据进行特征提取,预测精度及收敛速度受限。

技术实现思路

[0004]针对上述问题,本专利技术提供了一种基于知识蒸馏的曲轴内部缺陷检测方法及检测设备,基于交叉注意力机制,同时对时域、频域和时频域三种数据提取特征,解决了跨模态特征之间的差异性,将三种模态的特征进行对齐,有效地实现网络的收敛速度和预测精度的提高。
[0005]本专利技术的技术方案是:第一方面,本专利技术提供了一种基于知识蒸馏的曲轴内部缺陷检测方法,包括:采集曲轴正常状态和缺陷状态下的激振信号,同一状态进行多次采集,将所述激振信号变换得到时域数据、频域数据及时频域数据,构建振动数据集;构建教师模型

学生模型,所述教师模型包含多条并行的且框架均为ResNet

50的卷积神经网络;所述学生模型包括框架为AlexNet的卷积神经网络;采用所述振动数据集对所述教师模型进行训练,具体包括:对于所述时域数据和频域数据,采用一维卷积提取特征;对于所述时频域数据,采用二维卷积提取特征,并在最后一层卷积层后,将二维特征图展成一维;使用交叉注意力机制使三种特征进行对齐,然后在特征堆叠融合后通过全连接层输出曲轴的分类类别;保存测试精度最高的权重;将所述时域数据输入所述学生模型并将所述振动数据集输入教师模型,利用知识蒸馏,使学生模型的输出向教师模型的输出不断靠近,训练出与教师模型的预测精度相当的学生模型,并保存权重;采集待检测曲轴的激振信号,并将激振信号输入至已训练好的所述学生模型,得到分类结果。
[0006]上述技术方案的工作原理如下:
本专利技术的曲轴内部缺陷检测方法能实现曲轴内部缺陷的自动化检测,加快了曲轴检测的速度,降低成本;同时利用知识蒸馏技术,将大模型较高的预测性能迁移到小模型上,解决了小模型推理速度快、预测精度差,大模型预测精度高、推理时间慢的问题;并创新性地提出了交叉注意力机制,对时域、频域及时频域分别提取特征,解决了跨模态特征之间的差异性,将三种模态的特征进行对齐,有效地实现网络的收敛速度和预测精度的提高。
[0007]在进一步的技术方案中,对所述学生模型进行训练具体包括:将所述教师模型和学生模型的结果输入到带有温度T的softmax函数中,即;其中为输出概率,是以自然常数e为底的指数函数,为神经网络的逻辑输出;构建损失函数,损失函数由两部分损失组成,第一部分为软损失,指的是学生模型与教师模型两者的软化输出的KL散度;第二部分为硬损失,指的是学生模型输出与真实标签的交叉熵损失,整个知识蒸馏模型的损失为,其中λ为所述软损失的权重, ;所述学生模型使用Adam参数优化算法和误差反向传播方法来最小化损失函数,得到最优化网络参数,最终保存预测精度最高的学生模型。
[0008]如此设置,能够优化学生模型的网络参数,从而提升预测精度。
[0009]在进一步的技术方案中,在采集所述激振信号后,对所述激振信号进行预处理;其中,所述预处理包括归一化、间隔采样或数据增强中的至少一种。
[0010]通过归一化处理,能够有效降低特征信息冗余度,提高特征提取速度,使采集的振动波形尺寸保持在(0,1)区间,保证网络模型的高效训练;通过间隔采样减小采样的点数,能加快网络的推理速度;通过数据增强能够增加样本的数量,平衡有缺陷和正常曲轴数量,提高网络的泛化能力和稳定性。
[0011]在进一步的技术方案中,在构建所述教师

学生模型时,所述教师模型采用Adam参数优化算法和误差反向传播方法来最小化损失函数,以得到最优化网络参数。如此设置,能够优化教师模型的网络参数,从而提升预测精度。
[0012]在进一步的技术方案中,在所述学生模型完成训练后,将所述学生模型部署到嵌入式设备中,通过软件实时显示采集的曲轴激振信号和检测结果。
[0013]如此设置,能够将学生模型应用到嵌入式设备中,从而实现快速自动检测曲轴的内部缺陷。
[0014]在进一步的技术方案中,所述构建教师模型

学生模型时,所述教师模型及学生模型均对应设置包括网络层数、激活函数、批次大小和初始学习率的模型参数。
[0015]第二方面,本专利技术提供了一种基于知识蒸馏的曲轴内部缺陷检测设备,包括计算机可读存储介质及处理器;所述计算机可读存储介质用于存储可执行指令;所述处理器用于读取所述可执行指令,并执行如上所述的曲轴内部缺陷检测方法。
[0016]本专利技术的有益效果是:本专利技术的曲轴内部缺陷检测方法能实现曲轴内部缺陷的自动化检测,加快了曲轴检测的速度,降低成本;同时利用知识蒸馏技术,将大模型较高的预测性能迁移到小模型
上,解决了小模型推理速度快、预测精度差,大模型预测精度高、推理时间慢的问题;并创新性地提出了交叉注意力机制,对时域、频域及时频域分别提取特征,解决了跨模态特征之间的差异性,将三种模态的特征进行对齐,有效地实现网络的收敛速度和预测精度的提高。
附图说明
[0017]图1为本专利技术实施例教师模型的训练架构图;图2为本专利技术实施例交叉注意力机制的架构原理图;图3为本专利技术实施例教师模型

学生模型的知识蒸馏示意图。
具体实施方式
[0018]下面结合附图对本专利技术的实施例作进一步说明。
[0019]实施例1如图1至图3所示,第一方面,本专利技术提供了一种基于知识蒸馏的曲轴内部缺陷检测方法,包括以下步骤。
[0020]S1、采集曲轴正常状态和缺陷状态下的激振信号(即图1中的振动信号),同一状态进行多次采集,将所述激振信号变换得到时域数据、频域数据及时频域数据,构建振动数据集。例如,对于曲轴状态未知的情况下,可以利用超声波检测曲轴是否具有内部缺陷。这里,激振信号的原始状态便是为时域数据,而频域数据和时频域数据分别可通过对时域数据分别进行傅里叶变换和语谱图变换得到。
[0021]S2、构建教师模型

学生模型,所述教师模型包含多条并行的且框架均为ResNet

50的卷积神经网络;所述学生模型包括框架为AlexNet的卷积神经网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识蒸馏的曲轴内部缺陷检测方法,其特征在于,包括:采集曲轴正常状态和缺陷状态下的激振信号,同一状态进行多次采集,将所述激振信号变换得到时域数据、频域数据及时频域数据,构建振动数据集;构建教师模型

学生模型,所述教师模型包含多条并行的且框架均为ResNet

50的卷积神经网络;所述学生模型包括框架为AlexNet的卷积神经网络;采用所述振动数据集对所述教师模型进行训练,具体包括:对于所述时域数据和频域数据,采用一维卷积提取特征;对于所述时频域数据,采用二维卷积提取特征,并在最后一层卷积层后,将二维特征图展成一维;使用交叉注意力机制使三种特征进行对齐,然后在特征堆叠融合后通过全连接层输出曲轴的分类类别;保存测试精度最高的权重;将所述时域数据输入所述学生模型并将所述振动数据集输入教师模型,利用知识蒸馏,使学生模型的输出向教师模型的输出不断靠近,训练出与教师模型的预测精度相当的学生模型,并保存权重;采集待检测曲轴的激振信号,并将激振信号输入至已训练好的所述学生模型,得到分类结果。2.根据权利要求1所述的曲轴内部缺陷检测方法,其特征在于,对所述学生模型进行训练具体包括:将所述教师模型和学生模型的结果输入到带有温度T的softmax函数中,即;其中为输出概率,是以自然常数e为底的指数函数,为神经网络的逻辑输出;构建损失函数,损失函数由两部分损失组成,第一部分为软损失,指的是学生模型与教师模型两者的软...

【专利技术属性】
技术研发人员:谢罗峰卢后洪殷鸣殷国富刘建华杨扬赖光勇杨敏余雅彬
申请(专利权)人:四川飞亚动力科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1