【技术实现步骤摘要】
Systems,1998.》通过对真实光谱添加不同程度的高斯噪声生成大量模拟光谱。
[0005]同时,在计算机视觉领域兴起的数据增强方法,例如生成对抗网络(Generative Adversarial Networks,GAN)也被引入了拉曼光谱分析领域《Yu S,Li H,Li X,et al.Classification of pathogens by Raman spectroscopy combined with generative adversarial networks[J].Science of The Total Environment,2020,726:138477》。生成对抗网络由生成模型(Generative Model)和判别模型(Discriminative Model)两部分组成,通过向生成模型输入噪声向量生成大量数据,并由判别模型根据真实数据对生成数据进行判别这种方式,使生成模型生成与真实数据分布基本一致的生成数据。将生成对抗网络应用于拉曼光谱,以原始拉曼光谱作为学习目标,直接产生与原始光谱相同维数的生成光谱。直接使用光谱信号训练生成对抗网络时,其卷积结构无法很好地利用光谱局部性特征,且训练过程不稳定,使得生成模型无法很好的模拟真实光谱数据的分布。实验证明,这样生成的光谱大都类似于原始光谱添加高斯噪声后的信号,直接加入数据库用于训练将降低物质分类的准确性,无法准确完成物质定性检测。初步分析,这是因为序列形式的拉曼光谱数据缺乏空间相关性造成的。生成对抗网络中的卷积核无法提取到足够的局部特性,从而导致了生成数据包含类似于噪 ...
【技术保护点】
【技术特征摘要】
1.一种拉曼光谱数据的智能建库方法,其特征在于,包括如下步骤:1)使用连续小波变换对数据库中第c种目标物质的所有原始拉曼光谱进行特征变换,得到原始拉曼光谱的二维数据信号,c=1,
…
,C,C为目标物质的种类数量;2)随机生成向量z,输入训练好的针对第c种目标物质的生成模型,获得对应的生成光谱的二维信号,重复本步骤M次,获得M个生成光谱的二维信号,并标注为第c种目标物质;3)对其它目标物质重复步骤1)
‑
2),则产生C
×
M个生成光谱的二维信号构成二维数据集合,联合步骤1)得到的原始拉曼光谱的二维信号建立一个大型的拉曼光谱数据库,其覆盖C类目标物质的大量已标注样本。2.如权利要求1所述的一种拉曼光谱数据的智能建库方法,其特征在于,步骤1)具体为:设原始拉曼光谱为S={s
j
|j=1,2,
…
,N
c
},其中N
c
表示标注了第c种目标物质的原始拉曼光谱的数目;每个拉曼光谱表示为s
j
(t),其中t=[t1,t2,
…
,t
n
]是拉曼光谱位移序列,n表示每个拉曼光谱位移序列的长度,s
j
(t
i
)表示在t
i
位置的拉曼光谱信号强度,i=1,2,...,n;对每一个拉曼光谱s
j
(t)使用连续小波变换进行特征变换,得到其时频域的二维信号:其中ψ(t)为小波母函数,a是长度为l的缩放因子向量,b为平移因子向量,其取值与t相同,则第c种目标物质的时频域二维数据集合:WT
sj
为l行n列的二维矩阵。3.如权利要求1所述的一种拉曼光谱数据的智能建库方法,其特征在于,步骤2)中,还包括训练针对第c种目标物质的生成对抗网络,其包括:先建立针对第c种目标物质的生成对抗网络,再将特征变换后的第c种目标物质的原始拉曼光谱的二维信号作为训练集输入该生成对抗网络进行训练,获得其中训练好的针对第c种目标物质的生成模型。4.如权利要求3所述的一种拉曼光谱数据的智能建库方法,其特征在于,预先构造针对第c种目标物质的生成对抗网络,其包括两个神经网络模型:生成模型G
c
和判别模型D
c
,将第c种目标物质的原始拉曼光谱的二维数据集合WT
c
分为若干批batch,每一批WT<...
【专利技术属性】
技术研发人员:吴德文,韩李翔,陈嘉祥,王思伟,李超然,刘国坤,罗思恒,曾勇明,谢怡,
申请(专利权)人:厦门市普识纳米科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。