当前位置: 首页 > 专利查询>复旦大学专利>正文

基于改进Transformer算法的金属内部夹杂物检测方法、系统技术方案

技术编号:39570138 阅读:9 留言:0更新日期:2023-12-03 19:21
本申请的实施例提供了一种基于改进Transformer算法的金属内部夹杂物检测方法、系统。该基于改进Transformer算法的金属内部夹杂物检测方法包括:利用水浸式超声C扫成像检测设备,对金属材料进行扫描,得到带噪声与缺陷回波信号的原始超声信号;构建改进的Transformer架构并进行训练,利用训练好的模型对原始超声信号进行异常检测,输出异常结果,得到相应金属材料内部的夹杂物情况,以便于采用金属内部夹杂物检测的改进Transformer架构,克服传统夹杂物检测方法易受背景噪声或散射噪声影响检测效果下降的问题。散射噪声影响检测效果下降的问题。散射噪声影响检测效果下降的问题。

【技术实现步骤摘要】
基于改进Transformer算法的金属内部夹杂物检测方法、系统


[0001]本申请涉及金属内部夹杂物检测
,具体而言,涉及一种基于改进Transformer算法的金属内部夹杂物检测方法、系统。

技术介绍

[0002]随着工业制造和生产信息化程度的不断提高,金属材料中微量非金属夹杂物将严重影响产品质量和使用寿命。基于超声信号分析的方法通常是通过检测信号的异常部分来检测材料中的夹杂物。目前,人工智能和深度学习方法是研究时间序列异常检测的主要方法。基于变压器的序列建模能力,自然更适合于时间序列,也是一种序列型数据结构。随着技术的发展,变压器开始在时间序列预测、视觉分类、检测等领域进行争夺。然而,每个特定领域的输入数据都具有自相关性、周期性等特殊特征,这给变压器在不同场景下的应用带来了新的挑战,使得针对不同任务的多种Transformer架构出现在业界。当超声波在材料内部传播时,粗糙颗粒产生的背景噪声或散射噪声给微小夹杂物的检测带来了困难,导致传统夹杂物检测方法易受背景噪声或散射噪声影响检测效果下降。

技术实现思路

[0003]本申请的实施例提供了一种基于改进Transformer算法的金属内部夹杂物检测方法、系统,进而至少在一定程度上实现了通过构建改进的Transformer架构并进行训练,利用训练好的模型对原始超声信号进行异常检测,输出异常结果,得到相应金属材料内部的夹杂物情况,以便于采用金属内部夹杂物检测的改进Transformer架构,克服传统夹杂物检测方法易受背景噪声或散射噪声影响检测效果下降的问题。
[0004]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0005]根据本申请实施例的一个方面,提供了一种基于改进Transformer算法的金属内部夹杂物检测方法,包括:
[0006]利用水浸式超声C扫成像检测设备,对金属材料进行扫描,得到带噪声与缺陷回波信号的原始超声信号;
[0007]构建改进的Transformer架构并进行训练,利用训练好的模型对原始超声信号进行异常检测,输出异常结果,得到相应金属材料内部的夹杂物情况。
[0008]在本申请的一些实施例中,所述构建改进的Transformer架构并进行训练,利用训练好的模型对原始超声信号进行异常检测,输出异常结果,得到相应金属材料内部的夹杂物情况,包括:
[0009]依次构建编码器、解码器;
[0010]根据编码器、解码器依次对异常结果进行训练,其中,构建改进的Transformer架构并进行训练,利用训练好的模型对原始超声信号进行异常检测;
[0011]输出异常结果,得到相应金属材料内部的夹杂物情况。
[0012]在本申请的一些实施例中,所述构建编码器包括:
[0013]将原始超声信号进行数据处理;其中,使用结合上下文的一维卷积对输入数据进行处理,分别用核大小为{1,k,1}与步长为1的卷积计算,将输入转换为Q(查询)、K(键)和V(值),这种位置感知实现使注意力关注局部上下文,使得更相关的特征能够得到匹配。
[0014]将Q(查询)、K(键)和V(值)输入到降噪自注意力机制模块,计算得到降噪自注意力向量,然后经过归一化(Add&Normalize);
[0015]将向量Z经过Feed Forward网络和归一化(Add&Normalize)生成高阶向量R1;
[0016]将高阶向量R输入到下一个Encoder,经过6个Encoder,生成最终高阶向量R2。
[0017]在本申请的一些实施例中,所述将步骤S1中得到的Q(查询)、K(键)和V(值)输入到降噪自注意力机制模块,计算得到降噪自注意力向量,然后经过归一化(Add&Normalize),包括:
[0018]降噪注意力机制模块由池化层、两个权值分布的全连接层和两个激活函数层组成;
[0019]向量Q和K经由全局池化、全连接层、ReLU激活层、全连接层以及sigmoid激活层得到向量Q1和K1;
[0020]计算Q1与K1的点积再除以根号dk,这里的dk是attention的输出维度大小,计算得到e1,对上述的Attention score值进行softmax转换得到概率值α1(也可以认为是value的系数)了,将上述概率值(α1)乘以对应的v值,每个维度对应相加后便得到了Z1;
[0021]计算公式如下:
[0022][0023]在本申请的一些实施例中,所述构建解码器包括:
[0024]将原始超声信号进行数据处理后输入到第一层解码器中得到outputs矩阵,用Mask矩阵作用于Outputs矩阵,mask矩阵中元素“1”对应的Outputs单元元素保留原值,“0”对应的Outputs单元元素替换为负极大值。便可得到对应的Attention score的矩阵;
[0025]Attention score的矩阵经过归一化(Add&Normalize)后的向量作为Query,步骤S4生成的高阶向量作为Key和Value,输入到降噪自注意力机制模块,计算得到降噪自注意力向量,然后经过归一化(Add&Normalize);
[0026]向量经过全连接层和sigmoid激活函数,得到输出O;
[0027]将输出输入到下一层decoder中,经过6个decoder,得到最终结果;
[0028]根据最终结果构建损失函数,并确定异常结果,以得到相应金属材料内部的夹杂物情况。
[0029]在本申请的一些实施例中,所方法还包括:
[0030]损失函数考虑到当涉及噪声刺激或参数扰动时,不可避免地会出现过拟合和不适定解问题,采用基于L2正则化的稀疏回归对输出权值进行精细学习。
[0031]在本申请的一些实施例中,所方法还包括:
[0032]使用L2范数定义每个解码器的重构损失,具体公式为:
[0033][0034]式中,其中λ为L2正则化的惩罚参数。为了计算方便,将系数1/L替换为1/2。
[0035]在本申请的一些实施例中,所方法还包括:
[0036]输出O的具体公式为:
[0037][0038][0039][0040][0041]根据本申请实施例的一个方面,提供了一种基于改进Transformer算法的金属内部夹杂物检测系统,包括:
[0042]信号模块,用于利用水浸式超声C扫成像检测设备,对金属材料进行扫描,得到带噪声与缺陷回波信号的原始超声信号;
[0043]结果模块,用于构建改进的Transformer架构并进行训练,利用训练好的模型对原始超声信号进行异常检测,输出异常结果,得到相应金属材料内部的夹杂物情况。
[0044]根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进Transformer算法的金属内部夹杂物检测方法,其特征在于,包括:利用水浸式超声C扫成像检测设备,对金属材料进行扫描,得到带噪声与缺陷回波信号的原始超声信号;构建改进的Transformer架构并进行训练,利用训练好的模型对原始超声信号进行异常检测,输出异常结果,得到相应金属材料内部的夹杂物情况。2.根据权利要求1所述的方法,其特征在于,所述构建改进的Transformer架构并进行训练,利用训练好的模型对原始超声信号进行异常检测,输出异常结果,得到相应金属材料内部的夹杂物情况,包括:依次构建编码器、解码器;根据编码器、解码器依次对异常结果进行训练,其中,构建改进的Transformer架构并进行训练,利用训练好的模型对原始超声信号进行异常检测;输出异常结果,得到相应金属材料内部的夹杂物情况。3.根据权利要求1所述的方法,其特征在于,所述构建编码器包括:将原始超声信号进行数据处理;其中,使用结合上下文的一维卷积对输入数据进行处理,分别用核大小为{1,k,1}与步长为1的卷积计算,将输入转换为Q(查询)、K(键)和V(值),这种位置感知实现使注意力关注局部上下文,使得更相关的特征能够得到匹配。将Q(查询)、K(键)和V(值)输入到降噪自注意力机制模块,计算得到降噪自注意力向量,然后经过归一化(Add&Normalize);将向量Z经过Feed Forward网络和归一化(Add&Normalize)生成高阶向量R1;将高阶向量R输入到下一个Encoder,经过6个Encoder,生成最终高阶向量R2。4.根据权利要求3所述的方法,其特征在于,所述将步骤S1中得到的Q(查询)、K(键)和V(值)输入到降噪自注意力机制模块,计算得到降噪自注意力向量,然后经过归一化(Add&Normalize),包括:降噪注意力机制模块由池化层、两个权值分布的全连接层和两个激活函数层组成;向量Q和K经由全局池化、全连接层、ReLU激活层、全连接层以及sigmoid激活层得到向量Q1和K1;计算Q1与K1的点积再除以根号dk,这里的dk是attention的输出维度大小,计算得到e1,对上述的Attention score值进行softmax转换得到概率值α1(也可以认为是value的系数)了...

【专利技术属性】
技术研发人员:陈雄房晓鑫
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1