基于卷积神经网络的样本分类识别方法技术

技术编号:32504532 阅读:13 留言:0更新日期:2022-03-02 10:14
本发明专利技术实施例提供了一种基于卷积神经网络的样本分类识别方法,卷积神经网络训练过程中,在原始训练数据的基础上,通过排列组合的方式来得到一定数量的训练数据,之后基于实际应用中不同设备、不同环境下针对目标物质采集得到的光谱数据与实际光谱数据之间差异变化范围特点,通过调整训练数据的波长及强度的方式,来模拟通过不同设备、不同环境下采集的光谱数据,使得训练得到的卷积神经网络适用于不同设备、不同环境下采集的光谱数据的分类识别,从而无需再使用标准物质进行校准;此外,通过对原始训练数据进行随机组合以及模拟调整的方式增加数据量,能够降低原始训练数据的采集量,即在小样本情况下达到预期的卷积神经网络识别效果。络识别效果。络识别效果。

【技术实现步骤摘要】
基于卷积神经网络的样本分类识别方法


[0001]本专利技术涉及激光诱导击穿光谱
,特别是涉及一种基于卷积神经网络的样本分类识别方法。

技术介绍

[0002]激光诱导击穿光谱(LIBS,laser

induced breakdown spectroscopy)技术是利用超短脉冲激光聚焦样品表面形成等离子体,进而对等离子体发射的光谱数据进行分析,从而识别物质所属类别的技术。
[0003]而在实际应用激光诱导击穿光谱技术识别物质类别的过程中,由于受到激光诱导击穿光谱设备本身以及设备所处环境的影响,导致检测得到的光谱数据与待检测物质的实际光谱数据之间存在差异,差异主要体现在检测得到的光谱数据与实际光谱数据之间横坐标表示的波长、纵坐标表示的强度在一定范围内发生偏移,此种情况下,如果利用检测得到的光谱数据识别物质类别,则会对识别准确率产生不利影响;比如,针对铁矿石由于检测得到的光谱数据与铁矿石的实际光谱数据之间存在差异,则可能会将铁矿石归类为非铁矿石。
[0004]相关技术中,为了增强识别准确率,通常在识别物质类别之前,利用标准物质进行校准,比如,传统的峰位校准法,是通过检测标准物质,根据标准物质的实际光谱数据中特征峰处的波长来校准检测得到的光谱数据的波长,但是,这种方法只能保证用作校准的特征峰处的波长的准确,而其他波长范围内依然存在不同程度的波长误差,对识别准确率依然存在不利影响。

技术实现思路

[0005]针对上述问题,本专利技术实施例提供了一种基于卷积神经网络的样本分类识别方法。
[0006]本专利技术实施的一方面,提供了一种基于卷积神经网络的样本分类识别方法,所述方法包括:S1、采集原始训练数据利用激光诱导击穿光谱设备采集目标物质的光谱数据,作为原始训练数据,目标物质为与待分类样本所属相同类别的物质;S2、对原始训练数据进行求和运算得到训练数据在原始训练数据中随机抽取多条数据并求和得到一条求和数据,重复在原始训练数据中随机抽取多条数据并求和得到一条求和数据的步骤,直至得到预定数量条求和数据,作为训练数据;S3、对S2中得到的训练数据横坐标表示的波长进行随机调整针对S2中得到的每一条训练数据的横坐标,逐坐标点对应的波长数值加上一个随机数,得到新的训练数据;
S4、对S2中得到的训练数据纵坐标表示的强度进行随机调整针对S2中得到的每一条训练数据的纵坐标,逐坐标点对应的强度数值乘上一个随机生成的三阶平滑曲线,得到新的训练数据;S5、针对S2中得到的训练数据纵坐标表示的强度进行随机窗口长度的均值滤波针对S2中得到的每一条训练数据的纵坐标,逐坐标点做窗口长度为2W+1的均值滤波,得到新的训练数据,其中,窗口长度为2W+1的均值滤波为取坐标点对应的强度数值以及在坐标点前后各W个坐标点对应的强度数值之间平均值的过程,W取整数;S6、针对S2中得到的训练数据纵坐标表示的强度随机叠加白噪声针对S2中得到的每一条训练数据的纵坐标,逐坐标点随机叠加白噪声,得到新的训练数据;S7、卷积神经网络的训练对S3、S4、S5以及S6中得到的每一条新的训练数据进行横坐标标准化,得到标准横坐标下的光谱数据,作为输入光谱数据,将每一输入光谱数据输入初始卷积神经网络得到预估类别,基于所得到的预估类别与实际类别,利用损失函数计算损失值,在计算得到的损失值不收敛的情况下,基于计算得到的损失值利用反向传播算法调整初始卷积神经网络中各个可训练参数的参数值,在损失值收敛的情况下,将当前初始卷积神经网络作为用于识别待分类样本类别的最终卷积神经网络,其中,实际类别为输入光谱数据对应的目标物质实际所属的类别;S8、识别待分类样本所属类别利用激光诱导击穿光谱设备采集待分类样本的光谱数据,并将采集到的待分类样本的光谱数据输入S7中得到的最终卷积神经网络得到待分类样本的类别。
[0007]与现有技术相比,本专利技术的有益效果在于:卷积神经网络的训练过程中,在利用激光诱导击穿光谱设备采集目标物质得到的原始训练数据的基础上,通过排列组合的方式来增加数据量进而得到训练数据,之后基于实际应用中不同设备、不同环境下针对目标物质检测得到的光谱数据与实际光谱数据之间差异变化范围特点,通过调整训练数据横坐标表示的波长及纵坐标表示的强度的方式,来模拟不同设备、不同环境下检测得到的光谱数据,从而得到用于训练卷积神经网络的训练数据并进行训练,使得训练得到的卷积神经网络适用于不同设备、不同环境下采集的光谱数据的分类识别,从而无需再使用标准物质进行校准;此外,卷积神经网络的识别效果主要取决于训练数据的数据量,要想达到预期识别效果通常需要几十万条的训练数据量,而实际中,通过激光诱导击穿光谱设备采集几十万条数据量是难以实现的,而本申请通过对原始训练数据进行随机组合以及模拟调整的方式增加数据量,能够降低原始训练数据的采集量,即在小样本情况下达到预期的卷积神经网络的识别效果。
[0008]可选的,S3中随机数的取值范围为(

1*Min(X
i

X
i
‑1,X
i+1

X
i
), Min(X
i

X
i
‑1,X
i+1

X
i
)),X
i
表示训练数据的横坐标X中第i个坐标点对应的波长数值,i取整数。
[0009]可选的,S6中白噪声的方差为V*maxI,其中maxI为当前随机叠加白噪声的训练数据纵坐标表示的强度中的最大强度数值,V为预设数值取值范围为(0,1)。
[0010]可选的,S7中横坐标标准化,得到标准横坐标下的光谱数据的过程包括:将S3、S4、S5以及S6中得到的每一条新的训练数据使用三次样条插值法得到标准横坐标下的光谱数
据。
[0011]可选的,S7中初始卷积神经网络包括输入层、第一卷积层、第一激活层、第一池化层、第二卷积层、第二激活层、第二池化层、第三卷积层、第三激活层、第三池化层、全局平均池化层、全连接层以及输出层。
[0012]可选的,将每一输入光谱数据输入初始卷积神经网络得到预估类别的步骤包括:输入层接收输入光谱数据;第一卷积层采用8种卷积核以步长1对输入光谱数据进行卷积运算,得到8个特征图,8种卷积核的特征尺寸均为21*1;第一激活层通过relu激活运算将8个特征图中的负值置为零;第一池化层采用特征尺寸为2*1的滤波器以步长2对relu激活运算后的8个特征图进行最大池化运算,得到经池化处理后的8个特征图;第二卷积层采用16种卷积核对经第一池化层池化处理后的8个特征图进行卷积运算,得到16个特征图,16种卷积核的特征尺寸均为11*1;第二激活层通过relu激活运算将16个特征图中的负值置为零;第二池化层采用特征尺寸为2*1的滤波器以步长2对relu激活运算后的16个特征图进行最大池化运算,得到池化处理后的16个特征图;第三卷积层采用32种卷积核对经第二池化层池化处理后的16个特征图进行卷积运算,得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的样本分类识别方法,其特征在于,所述方法包括:S1、采集原始训练数据利用激光诱导击穿光谱设备采集目标物质的光谱数据,作为原始训练数据,目标物质为与待分类样本所属相同类别的物质;S2、对原始训练数据进行求和运算得到训练数据在原始训练数据中随机抽取多条数据并求和得到一条求和数据,重复在原始训练数据中随机抽取多条数据并求和得到一条求和数据的步骤,直至得到预定数量条求和数据,作为训练数据;S3、对S2中得到的训练数据横坐标表示的波长进行随机调整针对S2中得到的每一条训练数据的横坐标,逐坐标点对应的波长数值加上一个随机数,得到新的训练数据;S4、对S2中得到的训练数据纵坐标表示的强度进行随机调整针对S2中得到的每一条训练数据的纵坐标,逐坐标点对应的强度数值乘上一个随机生成的三阶平滑曲线,得到新的训练数据;S5、针对S2中得到的训练数据纵坐标表示的强度进行随机窗口长度的均值滤波针对S2中得到的每一条训练数据的纵坐标,逐坐标点做窗口长度为2W+1的均值滤波,得到新的训练数据,其中,窗口长度为2W+1的均值滤波为取坐标点对应的强度数值以及在坐标点前后各W个坐标点对应的强度数值之间平均值的过程,W取整数;S6、针对S2中得到的训练数据纵坐标表示的强度随机叠加白噪声针对S2中得到的每一条训练数据的纵坐标,逐坐标点随机叠加白噪声,得到新的训练数据;S7、卷积神经网络的训练对S3、S4、S5以及S6中得到的每一条新的训练数据进行横坐标标准化,得到标准横坐标下的光谱数据,作为输入光谱数据,将每一输入光谱数据输入初始卷积神经网络得到预估类别,基于所得到的预估类别与实际类别,利用损失函数计算损失值,在计算得到的损失值不收敛的情况下,基于计算得到的损失值利用反向传播算法调整初始卷积神经网络中各个可训练参数的参数值,在损失值收敛的情况下,将当前初始卷积神经网络作为用于识别待分类样本类别的最终卷积神经网络,其中,实际类别为输入光谱数据对应的目标物质实际所属的类别;S8、识别待分类样本所属类别利用激光诱导击穿光谱设备采集待分类样本的光谱数据,并将采集到的待分类样本的光谱数据输入S7中得到的最终卷积神经网络得到待分类样本的类别。2.如权利要求1所述的基于卷积神经网络的样本分类识别方法,其特征在于,S3中随机数的取值范围为(

1*Min(X
i

X
i
‑1,X
i+1

X
i
), Min(X
i

X
i
‑1,X
i+1

X
i
)),X
i
表示训练数据的横坐标X中第i个坐标点对应的波长数值,...

【专利技术属性】
技术研发人员:胡煜王利兵韩伟王建年杨博锋丁利杨永超
申请(专利权)人:津海威视技术天津有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1