一种基于生成对抗网络的光谱数据库扩展方法技术

技术编号:20655345 阅读:51 留言:0更新日期:2019-03-23 06:58
本发明专利技术涉及一种基于生成对抗网络的光谱数据库扩展方法,属于光谱检测技术领域,广泛适用于近红外光谱、拉曼光谱、激光诱导击穿光谱、荧光光谱和太赫兹等光谱数据库的扩展。利用光谱测量系统对被测样本进行测量得到少量实验光谱。根据所获得的实验光谱的维数生成相同维数的原始生成光谱。构造生成网络G和判别网络D,对生成网络和判别网络进行共享参数式的交互训练。重复以上交互训练步骤,随交互训练次数增多,生成光谱逐渐趋近于原始实验光谱。采用但不限于非监督学习聚类分析方法,对生成光谱和原始实验光谱的相似度进行判断。若不满足要求,则重复交互训练步骤;若满足要求,则用生成光谱和原始光谱一起构成光谱数据库。

【技术实现步骤摘要】
一种基于生成对抗网络的光谱数据库扩展方法
本专利技术涉及一种基于生成对抗网络的光谱数据库扩展方法,属于光谱检测

技术介绍
光谱分析技术,例如近红外光谱(NearInfraredSpectroscopy)、拉曼光谱(RamanSpectroscopy)、激光诱导击穿光谱(Laser-inducedbreakdownspectroscopy,LIBS)、荧光光谱(FluorescenceSpectroscopy)和太赫兹光谱(Terahertzspectroscopy)等,目前已经在爆炸物检测、临床医学样本检测、文化遗产鉴定、合金加工过程、太空探索和农业与食品分析等领域得到广泛研究和应用。根据获得的光谱,可以对物质进行判别分析或分类识别。由于光谱技术具有快速实时、便捷准确和可在线原位检测的优势,将在分类识别领域发挥越来越重要的作用。当利用光谱数据进行识别分类时,为了构建分类模型,首先要建立光谱数据库。因为每张谱图在获取过程中都会受到环境和仪器本身性能的影响,导致每张谱图并不是完全一样,而是具有一定的随机性。因此,仅用少量光谱数据构建光谱数据库是不恰当的,需要对每种物质获取大量光谱用来建库,以覆盖类内随机性范围,使得类内光谱数据和不同类光谱数据的区分更加准确。然而在某些特殊场合和领域,往往难以获得足够的光谱数据用于建库。例如,LIBS技术是利用高能激光脉冲烧蚀被测样本表面,使样本产生等离子体,辐射发出特征光谱。LIBS技术并不是对样本完全无损的检测技术,在对珍贵样本或难获取的样本进行探测时,由于样本成本高导致难以获取大量光谱数据。而Raman光谱技术在获取每发光谱数据时需要较长的积分时间,尤其对于采用脉冲激光进行激发的Raman装置,常常需要多个激光脉冲的激发累积才能获得一个信背比较好的Raman光谱。这使得获取足够光谱需要的时间大大增加,从而增加了人力物力。这些都给很多特殊领域和场合的分类识别应用带来了困难,迫切需要找到一种能够基于少量实验光谱完成光谱数据库扩展,进而进行建模实现光谱分类识别的方法。
技术实现思路
本专利技术的目的是为了解决难以获得足够光谱数据用于建立数据库的难题,提供一种基于生成对抗网络的光谱数据库扩展方法,可以广泛适用于近红外光谱、拉曼光谱、激光诱导击穿光谱、荧光光谱和太赫兹等光谱数据库的扩展,对以上方法适应检测的每种物质的光谱均可以进行仿真模拟,解决了在特殊领域和场合难以获取大量光谱数据的问题。本专利技术的技术方案如下:一种基于生成对抗网络的光谱数据库扩展方法,其特征是该方法包括如下步骤:1.进行光谱数据采集。搭建光谱采集实验装置,进行待测样品的光谱数据采集。2.构建生成对抗网络(包括生成网络G和判别网络D)。使用人工神经网络模型构造生成网络模型G,根据所采用的原始实验光谱,产生相同维度的指定均值和方差的正态分布随机数序列,作为原始生成光谱;3.利用生成光谱和实验光谱构建判别网络模型D。判别网络模型D为一个二分类的神经网络模型,最少设置层数为3层,最后一层为输出层,输出层节点数为1。使用D网络对原始实验光谱和生成光谱进行判别分析,将原始实验光谱和生成光谱视为不同类样本,得到D网络的训练参数。对判别网络D进行训练时设定损失函数如下:其中,D(x)为判别网络在原始真实光谱数据集上的输出,x~pdata为原始真实光谱数据集的概率分布,D(G(z))为判别网络在生成网络生成的仿真光谱数据集上的输出,z~pz(z)为生成网络仿真的光谱数据集概率分布,z为随机向量,Ex~pdata(x)[logD(x)]表示判别网络可以区分出真实实验所得光谱和仿真所得光谱数据,Ez~pz(z)[log(1-D(G(z)))]表示生成网络可以生成判别网络无法区分的仿真光谱数据。4.共享D网络的训练参数,对生成网络模型G进行训练。此时将原始实验光谱和生成光谱视为同类样本,对生成网络G进行训练时设定损失函数如下:其中各项的意义与判别网络D的损失函数中各项意义相同。损失函数可联合定义为:5.根据训练得到的新的生成网络G,生成新的仿真光谱。6.重复步骤3-5,使生成光谱逐渐趋近于原始实验光谱。7.对生成光谱和原始实验光谱进行相似度判断。采用但不限于非监督学习聚类分析方法,对生成光谱和原始实验光谱的相似度进行判断。若不满足要求,则重复步骤3-5;若满足要求,则用生成光谱和原始光谱一起构成光谱数据库。有益效果光谱检测方法是目前物质识别与检测中具有潜力的分析方法之一。但是在很多特殊应用场合,难以快速方便地获取大量数据用于建立光谱数据库。本专利技术所提出的一种基于生成对抗网络的光谱数据库扩展方法与现有技术相比能够通过少量实验光谱数据构建大量与实验光谱极为相似的生成光谱数据,完成光谱数据库的扩展,解决了针对难以获取足够样品和难以测量足够时间等特殊情况下光谱数据建库难的问题,为推广光谱识别探测方法在这些特殊领域的应用提供了可能。附图说明图1为本专利技术方法流程示意图;图2为一种激光诱导击穿光谱测量系统构成示意图;图3为一种拉曼光谱测量系统构成示意图;图4为实施例1中典型危险品高爆炸药CL-20的LIBS光谱生成光谱与原始光谱对比图,其中:(a)为生成光谱,(b)为实验光谱;图5为实施例1中典型危险品高爆炸药CL-20的LIBS光谱生成光谱与原始光谱采用非监督学习方法PCA的聚类分析结果;图6为实施例1中典型危险品高爆炸药CL-20的LIBS光谱生成光谱与原始光谱采用非监督学习方法K-means的聚类分析结果;图7为实施例2中典型危险品高爆炸药CL-20的Raman光谱生成光谱与原始光谱对比图,其中:(a)为生成光谱,(b)为实验光谱;图8为实施例2中典型危险品高爆炸药CL-20的Raman光谱生成光谱与原始光谱采用非监督学习方法PCA的聚类分析结果;图9为实施例2中典型危险品高爆炸药CL-20的Raman光谱生成光谱与原始光谱采用非监督学习方法K-means的聚类分析结果。具体实施方式为了更好地说明本专利技术的目的和优点,下面结合附图和实施例对本
技术实现思路
作进一步说明。实施例1以典型危险品高爆炸药CL-20的LIBS光谱为例,说明基于生成对抗网络的激光诱导击穿光谱和拉曼光谱数据扩展建模方法在LIBS光谱中的应用。步骤一、采集LIBS光谱搭建如图2所示的激光诱导击穿光谱实验装置,其中1为激光器、2为反射镜,3为聚焦透镜、4为激光诱导等离子体、5为光电探测器、6为三维样品台、7为光纤、8为延时器DG535、9为光谱仪,10为计算机。将CL-20粉末用双面胶粘附于载玻片表面,放置于样品台6上,采集LIBS光谱,激光器采用Nd:YAG激光器基频1064nm输出波长,频率1Hz,调整三维样品台,使每发光谱的采集点位于样本上不同位置,以避免表面CL-20样本烧蚀殆尽,激发玻璃玻片的光谱。去除聚焦调整的前几发光谱数据,共收集100发LIBS光谱。步骤二、构建生成对抗网络(包括生成网络G和判别网络D)。构造生成网络模型G,首次生成仿真光谱,根据所采用的CL-20原始实验光谱(4092维),产生100发相同维度的指定均值为0和方差为1的正态分布随机数序列。步骤三、利用生成光谱和实验光谱构建判别网络模型D。使用人工神经网络模型构造判别网络模型D,D为一个二分本文档来自技高网
...

【技术保护点】
1.一种基于生成对抗网络的光谱数据库扩展方法,其特征在于:具体步骤如下:1)进行光谱数据采集。搭建光谱采集实验装置,采集待测物的少量光谱数据;2)构建生成对抗网络(包括生成网络G和判别网络D);3)利用生成光谱和实验光谱构建判别网络模型D;4)共享D网络的训练参数,对生成网络模型G进行训练;5)根据训练得到的新的生成网络G,生成新的仿真光谱;6)重复步骤3‑5,使生成光谱逐渐趋近于原始实验光谱;7)对生成光谱和原始实验光谱进行相似度判断。

【技术特征摘要】
1.一种基于生成对抗网络的光谱数据库扩展方法,其特征在于:具体步骤如下:1)进行光谱数据采集。搭建光谱采集实验装置,采集待测物的少量光谱数据;2)构建生成对抗网络(包括生成网络G和判别网络D);3)利用生成光谱和实验光谱构建判别网络模型D;4)共享D网络的训练参数,对生成网络模型G进行训练;5)根据训练得到的新的生成网络G,生成新的仿真光谱;6)重复步骤3-5,使生成光谱逐渐趋近于原始实验光谱;7)对生成光谱和原始实验光谱进行相似度判断。2.根据权利要求1所述的一种基于生成对抗网络的光谱数据库扩展方法,其特征在于:所提出的数据库扩展方法同时适用于近红外光谱(NearInfraredSpectroscopy)、拉曼光谱(RamanSpectroscopy)、激光诱导击穿光谱(Laser-inducedbreakdownspectroscopy,简称LIBS)、荧光光谱(FluorescenceSpectroscopy)和太赫兹光谱(Terahertzspectroscopy)等,对以上方法适应检测的每种物质的光谱均可以进行仿真模拟,对测量系统和被测样品没有特殊限制。3.根据权利要求1所述的一种基于生成对抗网络的光谱数据库扩展方法,其特征在于:所述的步骤2)~6)中生成网络G和判别网络D共享参数交互训练模型包括以下具体步骤:1)构造生成网络模型G,首次生成仿真光谱,根据所采用的原始实验光谱(LIBS光谱或Raman光谱),产生相同维度的指定均值和方差的正态分布随机数序列;2)使用人工神经网络模型构造判别网络模型D,D...

【专利技术属性】
技术研发人员:王茜蒨腾格尔崔旭泰
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1