【技术实现步骤摘要】
拉曼光谱下基于相似度的混合物组分识别方法
本专利技术涉及成分分析
,尤其是一种拉曼光谱下基于相似度的混合物组分识别方法。
技术介绍
拉曼光谱技术是一种光谱分析技术,在对样品组成及含量分析领域具有广泛应用。拉曼光谱分析技术对与入射光频率不同的散射光谱进行分析以得到分子振动、转动方面信息,常被应用于物质成分(定性分析)和浓度(定量分析)的分析方法。拉曼光谱分析技术分析的是化学键或功能团的特征信息,不同物质有着不尽相同的化学键或功能团,表现在拉曼光谱上为不同的特征峰。在拉曼光谱数据中,获取其中隐藏的有用的信息用于混合物组分的识别是关键步骤。一般情况下,混合物的光谱比较复杂、谱峰重叠严重,以及不同组分之间的相互影响对混合物组分的识别提出了挑战。基于以上,混合物拉曼光谱有用信息的提取和分析是组分识别的前提和基础。在拉曼光谱分析中,对于混合物组分的识别方法通常有特征峰对比法、子空间重叠法、神经网络法。其中,特征峰对比法主要对比混合物和纯净物的特征峰,纯净物的特征峰能在混合物特征峰里找到,则判断混合物中存在该纯净物。子空间重叠法将待定性混合物光谱信息视为向量,通过计算混合物光谱与标准库光谱的子空间夹角,并根据其变化,排列筛选出混合物的组分。神经网络法,如卷积神经网络,通过训练模型调整参数,达到组分识别的目的。但上述几种方法都存在一定的缺陷:特征峰对比法在一些特定场合能有效识别混合物中的成分,但大部分情况下混合物的拉曼光谱谱峰众多,会出现重叠和覆盖的现象,同时由于检测环境复杂、仪器精度较低,拉曼谱峰可能会有偏移,并且特征峰对比法依赖于人眼的判定,较为费时费力。子空间 ...
【技术保护点】
1.一种拉曼光谱下基于相似度的混合物组分识别方法,其特征在于,所述混合物组分识别方法包括:采集N种纯净物的拉曼光谱,对于每一种纯净物,利用以第一小波为母小波函数的连续小波变换寻找所述纯净物的拉曼光谱的特征峰并根据所述特征峰得到所述纯净物的特征向量组,N为正整数;采集待识别混合物的拉曼光谱,利用以第二小波为母小波函数的连续小波变换寻找所述待识别混合物的拉曼光谱的特征峰并根据所述特征峰得到所述待识别混合物的特征向量组;分别根据所述待识别混合物的特征向量组和每一种纯净物的特征向量组计算得到所述待识别混合物和所述纯净物的相似度,将N个相似度由大到小排序并根据σ准则筛选出M种候选纯净物;对所述M种候选纯净物的光谱数据作校正处理,利用非负最小二乘拟合所述待识别混合物的光谱数据和校正后的所述M种候选纯净物的光谱数据得到各个候选纯净物的拟合系数,选取拟合系数最大的P种候选纯净物作为所述待识别混合物的组分识别结果。
【技术特征摘要】
1.一种拉曼光谱下基于相似度的混合物组分识别方法,其特征在于,所述混合物组分识别方法包括:采集N种纯净物的拉曼光谱,对于每一种纯净物,利用以第一小波为母小波函数的连续小波变换寻找所述纯净物的拉曼光谱的特征峰并根据所述特征峰得到所述纯净物的特征向量组,N为正整数;采集待识别混合物的拉曼光谱,利用以第二小波为母小波函数的连续小波变换寻找所述待识别混合物的拉曼光谱的特征峰并根据所述特征峰得到所述待识别混合物的特征向量组;分别根据所述待识别混合物的特征向量组和每一种纯净物的特征向量组计算得到所述待识别混合物和所述纯净物的相似度,将N个相似度由大到小排序并根据σ准则筛选出M种候选纯净物;对所述M种候选纯净物的光谱数据作校正处理,利用非负最小二乘拟合所述待识别混合物的光谱数据和校正后的所述M种候选纯净物的光谱数据得到各个候选纯净物的拟合系数,选取拟合系数最大的P种候选纯净物作为所述待识别混合物的组分识别结果。2.根据权利要求1所述的混合物组分识别方法,其特征在于,所述第一小波为墨西哥帽小波形式为:所述第二小波定义为:3.根据权利要求1所述的混合物组分识别方法,其特征在于,包括m个拉曼光谱的特征峰的所述纯净物的特征向量组包括m个特征向量,表示为每个特征向量分别对应所述纯净物的拉曼光谱的一个特征峰,对应于所述纯净物的第i个特征峰的第i个特征向量包括所述第i个特征峰的拉曼位移拉曼强度和半高宽i为参数;包括n个拉曼光谱的特征峰的所述待识别混合物的特征向量组包括n个特征向量,表示为每个特征向量分别对应所述待识别混合物的拉曼光谱的一个特征峰,对应于所述待识别混合物的第j个特征峰的第j个特征向量包括所述第j个特征峰的拉曼位移拉曼强度和半高宽j为参数。4.根据权利要求3所述的混合物组分识别方法,其特征在于,根据特征峰得到特征向量组,包括:利用斜率比较法对所述特征峰进行重叠峰的判断,得到单峰和重叠峰的区间,利用Voigt函数对特征峰进行拟合,对单峰区间的特征峰表示如下:对重叠峰区间的特征峰表示为Voigt函数的线性叠加,表示如下:其中,I(λ)表示拉曼位移为λ处的拉曼强度,λc表示谱峰的拉曼位移,Ic表示谱峰的拉曼强度,w表示谱峰的半高宽,θ表示谱峰的高斯-洛伦兹系数,l为重叠峰区间里重叠峰的个数;采用基于Levenberg-Marquardt算法的曲线拟合方法进行谱峰拟合,得到每个特征峰的特征向量,包括所述特征峰的拉曼位移、拉曼强度和半高宽;将各个特征峰的特征向量按照拉曼位移由小到大的顺序组成特征向量组。5.根据权利要求3所述的混合物组分识别方法,其特征在于,所述分别根据所述待识别混合物的特征向量组和每一种纯净物的特征向量组计算得到所述待识别混合物和所述纯净物的相似度,包括对于每一种纯净物:根据所述纯净物的每一个特征峰的拉曼位移和所述待识别混合物的每一个特征峰的拉曼位移对所述纯净物的各个特征峰和所述待识别混合物的各个特征峰进行峰位匹配,得到k对匹配成功的纯净物特征峰和待识别混合物特征峰;根据每一对匹配成功的纯净物特征峰和待识别混合物特征峰各自的拉曼位移和半高宽计算所述纯净物特征峰和待识别混合物特征峰的拉曼位移的相似度和半高宽的相似度;根据第a个匹配成功的纯净物特征峰的拉曼强度计算所述第a个匹配成功的纯净物特征峰的权重,a为参数;其中,a和b为参数,表示第a个匹配成功的纯净物特征峰的拉曼强度,表示第a个匹配成功的纯净物特征峰的权重;根据每一对匹配成功的纯净物特征峰和待识别混合物特征峰的拉曼位移的相似度和...
【专利技术属性】
技术研发人员:朱启兵,刘财政,黄敏,郭亚,
申请(专利权)人:江南大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。