System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于深度对抗自编码器的近红外光谱数据单类识别方法技术_技高网
当前位置: 首页 > 专利查询>温州大学专利>正文

基于深度对抗自编码器的近红外光谱数据单类识别方法技术

技术编号:40945069 阅读:4 留言:0更新日期:2024-04-18 15:02
本发明专利技术公开了一种基于深度对抗自编码器的近红外光谱单类识别方法,通过采用自编码器和判别器构建深度对抗自编码模型,自编码器的编码器和解码器均采用深度神经网络结构,使其能够更加有效地提取目标类近红外光谱数据的潜在特征表征信息,增强自编码器对目标类的识别灵敏性,另外,在对深度对抗自编码模型进行训练时,通过判别器与自编码器的对抗训练,使得潜在特征的分布符合设置的先验分布,后续在对未知样本进行识别时,将未知样本的潜在特征映射成所设置的先验分布,通过计算相应的概率密度对未知样本在潜在特征空间内的相似度进行评价,以此弥补传统自编码器依靠单一重构误差评价指标的不足;优点是具有较高的识别准确度。

【技术实现步骤摘要】

本专利技术涉及近红外光谱数据单类识别方法,尤其是涉及一种基于深度对抗自编码器的近红外光谱数据单类识别方法


技术介绍

1、近红外光谱检测是一种无损、快速的检测方法,可以用于物质属性的定量与定性分析。近红外光谱检测技术已经广泛应用于食品、农业、化工、医药等领域,并且得到了越来越多的认可。单类识别模型是近红外光谱识别方法中的一种重要类型。单类识别模型通过对目标类近红外数据的学习,可以识别出非目标类的近红外光谱数据。自编码器是一种常用的单类识别模型。现有的自编码器通常由编码器与解码器两部分组成,编码器通过对目标类数据的压缩,得到目标类数据的潜在特征表征方式,解码器根据目标类数据的潜在特征对其进行信号重构,得到与原始数据的重构误差。通过对目标类数据的学习,自编码器可以对与目标类数据分布相似的样本得到较小的重构误差。因此,对于一个未知样本,现有的基于自编码器的目标类近红外光谱数据的识别方法通过自编码器获取该未知样本与目标类数据的重构误差,进而基于重构误差的大小判断该未知样本是否属于目标类。

2、但是,现有的基于自编码器的目标类近红外光谱数据的识别方法中,由于自编码器的网络结构采用浅层网络,其所提取的潜在特征难以有效地表征目标类近红外光谱的特征信息,并且重构误差反应的仅仅是不能被提取的潜在特征表征的信息,而样本在潜在特征空间上的差异性没有考虑,从而导致自编码器得到的重构误差会存在较大的偏差,以致对目标类近红外光谱的识别准确度不高。


技术实现思路

1、本专利技术所要解决的技术问题是提供一种识别准确度较高的基于深度对抗自编码器的近红外光谱数据单类识别方法。

2、本专利技术解决上述技术问题所采用的技术方案为:一种基于深度对抗自编码器的近红外光谱单类识别方法,包括以下步骤:

3、步骤1、利用近红外光谱仪分别对m个目标类样本进行采集,得到每个目标类样本的近红外光谱,其中m为大于等于50的整数,m个目标类样本按照1至m随机编号,将编号为i的目标类样本称为第i个目标类样本,i∈{1,…,m},将第i个目标类样本的近红外光谱记为xi×p,xi×p为p个特征数构成的1行p列的数据矩阵,p等于近红外光谱仪的通道数,近红外光谱仪的每个通道采集第i个目标类样本的一个近红外光谱特征波段数据,xi×p中的p个特征数对应为近红外光谱仪的p个通道共采集到的第i个目标类样本的p个近红外光谱特征波段数据,将采集的m个目标类样本的近红外光谱构成数据矩阵,记为xm×p,xm×p为m行p列的数据矩阵,其中xi×p为xm×p的第i行数据;

4、步骤2、设置先验分布为标准正态分布,将其概率密度函数记为

5、步骤3、构建深度对抗自编码模型,所述的深度对抗自编码包括自编码器和判别器,所述的自编码器包括编码器和解码器,所述的编码器、所述的解码器和所述的判别器分别采用网络层数大于3的神经网络模型实现,所述的编码器用于将输入其内的高维信号压缩成低维的潜在特征输出至所述的解码器,所述的解码器用于将所述的编码器输出至其处的潜在特征重构成原始的高维信号,所述的判别器用于判别所述的编码器得到的潜在特征是否符合设置的先验分布;

6、步骤4、利用xm×p对所述的深度对抗自编码器进行训练,得到训练后的深度对抗自编码器,即识别模型;

7、步骤5、将xm×p作为所述的识别模型的输入,输入到所述的识别模型的编码器中,所述的识别模型的编码器对xm×p进行压缩,得到低维的潜在特征输出至所述的识别模型的解码器中,所述的识别模型的解码器对输出至其处的潜在特征进行重构,得到重构矩阵,将所述的识别模型的编码器得到的低维的潜在特征记为lm×v,所述的识别模型的解码器得到的重构矩阵记为lm×v为m行v列的数据矩阵,v是所述的识别模型的编码器的最后一层神经网络模型的神经元个数,取值为大于等于1的整数,lm×v中的第i行数据是xi×p对应的潜在特征,记为li×v,li×v为1行v列的数据矩阵,为m行p列的数据矩阵,将的第i行数据记为为的重构信号,为1行p列的数据矩阵;

8、步骤6、将xi×p与的差异程度记为ki,采用公式计算得到ki,||||2为二阶范数;将li×v代入所设置的概率密度函数得到对应的概率密度,记为

9、步骤7、设定第一个比例值q,其中0<q<0.1;利用分位点的计算方法得到{k1,k2,……,km}中对应q的分位点,将其记为q;设定第二个比例值b,其中0.9<b<1;利用分位点的计算方法得到中对应b的分位点,将其记为b;

10、步骤8、当对某个未知样本进行识别时,先采用步骤1相同的方法采集得到该未知样本的近红外光谱,将其记为为1行p列的数据矩阵,将作为所述的识别模型的输入,输入到所述的识别模型的编码器中,所述的识别模型的编码器对进行压缩,得到低维的潜在特征输出至所述的识别模型的解码器中,所述的识别模型的解码器对输出至其处的低维的潜在特征进行重构,得到重构信号输出,其中,将此时所述的识别模型的编码器得到的低维的潜在特征记为所述的识别模型的解码器得到的重构信号记为为1行v列的数据矩阵,为1行p列的数据矩阵;

11、步骤9、将和差异程度记为ku,采用公式计算得到ku,将代入所设置的概率密度函数中得到对应的概率密度,记为

12、步骤10、构造判别函数,如式(1)所示:

13、

14、式(1)中,表示判别结果,当等于1时,代表判别结果为目标类,当等于0时,代表判别结果为异常类,即非目标类;

15、步骤11、将ku和的取值代入公式(1),得到的值,根据的值得到是否是目标类的判别结果。

16、与现有技术相比,本专利技术的优点在于通过采用自编码器和判别器构建深度对抗自编码模型,自编码器中的编码器和解码器均采用深度神经网络结构,使其能够更加有效地提取目标类近红外光谱数据的潜在特征表征信息,从而得到更好的重构效果,增强自编码器对目标类的识别灵敏性,另外,对抗自编码器是自编码器与生成对抗技术的结合,通过判别器与自编码器的对抗训练,使得编码器抽取的潜在特征的分布符合设置的先验分布,通过对设置的先验分布的随机抽样和解码,可以生成与输入样本同分布的样本,后续在对未知样本进行识别时,将未知样本的潜在特征映射成所设置的先验分布,通过计算相应的概率密度对未知样本在潜在特征空间内的相似度进行评价,以此弥补传统自编码器依靠单一重构误差评价指标的不足,由此对未知样本具有较高的识别准确度。

本文档来自技高网...

【技术保护点】

1.一种基于深度对抗自编码器的近红外光谱单类识别方法,其特征在于包括以下步骤:

【技术特征摘要】

1.一种基于深度对抗自编码器的近红外光谱...

【专利技术属性】
技术研发人员:黄光造陈孝敬谢忠好
申请(专利权)人:温州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1