一种基于SMOTE_SVM的焊接缺陷样本的增广方法技术

技术编号:35205732 阅读:22 留言:0更新日期:2022-10-15 10:16
本发明专利技术公开了一种基于SMOTE_SVM的焊接缺陷样本的增广方法,属于数据处理领域。对SMOTE算法的采样倍率组合以及SVM的超参数进行优化,降低了过采样过程中噪声样本的影响;其次,利用SMOTE算法基于所获取的最优采样倍率对样本进行过采样,增加样本容量,方便后期将过采样得到的新数据样本加入原训练集作为新训练集;最后基于参数优化后的SVM进行模型训练,以构建出焊接缺陷识别模型实现焊接缺陷识别。构建出焊接缺陷识别模型实现焊接缺陷识别。构建出焊接缺陷识别模型实现焊接缺陷识别。

【技术实现步骤摘要】
一种基于SMOTE_SVM的焊接缺陷样本的增广方法


[0001]本专利技术涉及不平衡数据分类领域,尤其涉及一种应用于焊接缺陷识别的不平衡数据分类识别领域。

技术介绍

[0002]随着新能源行业的迅速崛起,新能源汽车需求量迅速增加,2021年全球新能源车型累计销量近650万辆,较2020年同期增长约108%。新能源汽车电池包底盘作为电池包的承载器件,其焊接质量的可靠性关系到电池组的安全性,与电动汽车的安全运行息息相关;同时,新能源汽车电池包底盘为典型的大尺寸铝合金零件,而由于铝合金零件熔点低、厚度薄等特点,其加工焊接容易出现飞溅、烧穿等缺陷。因此为保证电池组的可靠性,其焊接缺陷的检测尤为重要,但随着汽车需求量的不断增加,传统的人工检测面临着工作强度太大,效率过低等问题,这使企业对焊接缺陷检测技术提出了更高的要求。铝合金零件熔化极气体保护焊的焊接过程中电弧声音信号、电弧电信号中蕴含着与焊接缺陷紧密相关的信息。因此,从声、电信号中提取出与焊接缺陷密切相关的特征,并基于此构建出特征集合,能够实现对焊接动态过程全面、多元的描述,从而实现对焊接缺陷的识别。
[0003]但实际生产过程中,可获取的焊接缺陷样本远少于焊缝成型良好样本,这导致样本呈现不平衡分布的现象,而样本不均衡分布的情况下直接利用支持向量机进行训练效果并不理想。因此,需要对缺陷样本进行过采样以实现样本的平衡化分布。

技术实现思路

[0004]合成过采样技术(Synthetic Minority Oversampling Technique,SMOTE)经过众多研究表明其在不平衡数据分类问题上能取得良好的效果。然而,SMOTE算法不能对样本进行区别性的选择,导致易受到噪声样本的干扰。因此,一些改进的算法被提出,例如Borderline

SMOTE方法可对样本进行有区别的选择,以避免产生噪声样本。ASMOTE方法,通过定义近邻允许阈值避免了噪声样本的生成。上述研究对SMOTE的盲目性进行了改进,但与传统的SMOTE算法一样,所有合成的新样本皆为原样本的固定倍数,无法实现对样本的精确控制,并且也忽略了采样过程中SVM超参数的影响。因此,本文对SMOTE算法的采样倍率组合和SVM的超参数进行同时优化,在最小化分类错误率的条件下确定SVM最优超参数以及由最优采样倍率组合过采样得到的新数据样本。最后,将新数据样本加入原训练集作为新训练集,并利用优化超参数后的支持向量机进行训练,建立起焊接缺陷分类识别模型,最终实现焊接缺陷识别。
[0005]为了实现上述目的,首先对SMOTE算法的采样倍率组合以及SVM的超参数进行优化,降低了过采样过程中噪声样本的影响;其次,利用SMOTE算法基于所获取的最优采样倍率对样本进行过采样,并将过采样得到的新数据样本加入原训练集作为新训练集。本专利技术技术方案为一种基于SMOTE_SVM的焊接缺陷样本的增广方法,该方法包括以下步骤:
[0006]步骤1:获取数据样本,将样本数据集进行分类,针对每一类建立一个支持向量机;
[0007]步骤1.1:利用霍尔传感器采集焊接电流信号,利用声传感器采集焊接过程电弧声信号,为同步获取上述两种信号,将声、电信号采样频率皆设置为48kHz。同步获取信号之后,每种信号以4800个采样点作为一个样本,根据采样频率与样本的采样点数,每个样本可以代表0.1s的焊接过程,同时根据10mm/s的焊接速度,每个样本可以表征1mm大小的焊接情况,对焊接电流信号样本提取特征参数,并记获取的焊接电信号特征向量如下:
[0008]A
i
=[A
i,1
,A
i,2
,

,A
i,m
][0009]其中,i=1,2,

,n,n为样本数量;m为特征参数数量;A
i
为焊接电信号的第i个样本。对电弧声信号提取其梅尔频率倒谱系数作为特征参数,并记为:
[0010]D
i
=[D
i,1
,D
i,2
,

,D
i,p
][0011]其中,i=1,2,

,n,n为电弧声信号总帧数;p为梅尔频率倒谱系数的维数;D
i
为电弧声信号的第i个样本;最后构建声电样本矩阵如下:
[0012]s
i
=[A
i,1
,

,A
i,m
×
t
,D
i,1
,

,D
i,p
]T
[0013]步骤1.2:构建多分类支持向量机,其中二分类支持向量机数目由下式确定:
[0014][0015]其中,k为数据集分类数;
[0016]步骤2:对每个支持向量机,以SVM分类错误率最小化为优化目标,SMOTE算法的采样倍率组合以及SVM的超参数为决策变量,构建目标函数为:
[0017]min:y=f(X),X=(C,g,R1,R2,

,R
m
)
[0018]式中,f(X)为分类器的分类错误率,m为样本的个数,X为算法种群中的个体,R
i
为第i个样本的采样倍率C表示惩罚因子,定义如下:
[0019]C=(C
max

C
min
)
×
r+C
min
,i=1,2,

,n
[0020]g表示核函数参数,定义如下:
[0021]g=(g
max

g
min
)
×
r+g
min
,i=1,2,

,n
[0022]式中,r为取值为[0,1]的随机数;C
max
表示惩罚因子的上限,C
min
表示惩罚因子的下限;g
max
表示核函数参数的上限,g
min
表示核函数参数的下限;SMOTE采样倍率的子集定义如下:
[0023][0024]其中,round(
·
)为四舍五入函数,rand(0,1)表示取0到1之间的随机数;
[0025]步骤3:对目标函数进行求解,得出SMOTE最优采样倍率组合和SVM最优超参数;
[0026]步骤3.1:利用下式所示的Levy生成一个解,并计算解的目标函数值f
i
[0027][0028]式中,表示第i个解经t轮迭代后的结果;α>0为步长缩放因子;Levy(s,λ)可表达为:
[0029][0030]其中,λ为Levy飞行指数,通常取1;Γ函数对于给定的λ而言是一个常数,例如当λ
取1时,Γ(1+λ)=1;服从Levy分布的步长s根据Mantegna方法表达为:
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于SMOTE_SVM的焊接缺陷样本的增广方法,该方法包括以下步骤:步骤1:获取数据样本,将样本数据集进行分类,针对每一类建立一个支持向量机;步骤1.1:利用霍尔传感器采集焊接电流信号,利用声传感器采集焊接过程电弧声信号,为同步获取上述两种信号,将声、电信号采样频率皆设置为48kHz;同步获取信号之后,每种信号以4800个采样点作为一个样本,根据采样频率与样本的采样点数,每个样本可以代表0.1s的焊接过程,同时根据10mm/s的焊接速度,每个样本可以表征1mm大小的焊接情况,对焊接电流信号样本提取特征参数,并记获取的焊接电信号特征向量如下:A
i
=[A
i,1
,A
i,2
,

,A
i,m
]其中,i=1,2,

,n,n为样本数量;m为特征参数数量;A
i
为焊接电信号的第i个样本;对电弧声信号提取其梅尔频率倒谱系数作为特征参数,并记为:D
i
=[D
i,1
,D
i,2
,

,D
i,p
]其中,i=1,2,

,n,n为电弧声信号总帧数;p为梅尔频率倒谱系数的维数;D
i
为电弧声信号的第i个样本;最后构建声电样本矩阵如下:s
i
=[A
i,1
,

,A
i,m
×
t
,D
i,1
,

,D
i,p
]
T
步骤1.2:构建多分类支持向量机,其中二分类支持向量机数目由下式确定:其中,k为数据集分类数;步骤2:对每个支持向量机,以SVM分类错误率最小化为优化目标,SMOTE算法的采样倍率组合以及SVM的超参数为决策变量,构建目标函数为:min:y=f(X),X=(C,g,R1,R2,

,R
m
)式中,f(X)为分类器的分类错误率,m为样本的个数,X为算法种群中的个体,R
i
为第i个样本的采样倍率C表示惩罚因子,定义如下:C=(C
max

C
min
)
×
r+C
min
,i=1,2,

,ng表示核函数参数,定义如下:g=(g
max

g
min
)
×
r+g
min
,i=1,2,

,n式中,r为取值为[0,1]的随机数;C
max
表示惩罚...

【专利技术属性】
技术研发人员:李波周家豪刘民岷洪涛胡家文
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1