当前位置: 首页 > 专利查询>江南大学专利>正文

拉曼光谱下基于相似度的混合物组分识别方法技术

技术编号:22133880 阅读:54 留言:0更新日期:2019-09-18 07:54
本发明专利技术公开了一种拉曼光谱下基于相似度的混合物组分识别方法,涉及成分分析技术领域,该混合物组分识别方法采集纯净物和待识别混合物的拉曼光谱,针对纯净物和待识别混合物的不同特征,采用以不同小波作为母小波函数的连续小波变换寻找特征峰,识别准确;从寻找到的特征峰中提取特征向量组,从而进行纯净物和待识别混合物的相似度计算初步筛选出候选纯净物,对候选纯净物的光谱数据进行位移校正后,利用非负最小二乘得到最终的组分识别结果,整个流程无需人工参与,能快速且有效地应用于混合物组分识别,在一定程度上提高混合物识别的查准率和查全率,具有快速且无损、实现过程简单和识别结果准确等特点。

A Similarity-based Method for Component Recognition of Mixtures in Raman Spectra

【技术实现步骤摘要】
拉曼光谱下基于相似度的混合物组分识别方法
本专利技术涉及成分分析
,尤其是一种拉曼光谱下基于相似度的混合物组分识别方法。
技术介绍
拉曼光谱技术是一种光谱分析技术,在对样品组成及含量分析领域具有广泛应用。拉曼光谱分析技术对与入射光频率不同的散射光谱进行分析以得到分子振动、转动方面信息,常被应用于物质成分(定性分析)和浓度(定量分析)的分析方法。拉曼光谱分析技术分析的是化学键或功能团的特征信息,不同物质有着不尽相同的化学键或功能团,表现在拉曼光谱上为不同的特征峰。在拉曼光谱数据中,获取其中隐藏的有用的信息用于混合物组分的识别是关键步骤。一般情况下,混合物的光谱比较复杂、谱峰重叠严重,以及不同组分之间的相互影响对混合物组分的识别提出了挑战。基于以上,混合物拉曼光谱有用信息的提取和分析是组分识别的前提和基础。在拉曼光谱分析中,对于混合物组分的识别方法通常有特征峰对比法、子空间重叠法、神经网络法。其中,特征峰对比法主要对比混合物和纯净物的特征峰,纯净物的特征峰能在混合物特征峰里找到,则判断混合物中存在该纯净物。子空间重叠法将待定性混合物光谱信息视为向量,通过计算混合物光谱与标准库光谱的子空间夹角,并根据其变化,排列筛选出混合物的组分。神经网络法,如卷积神经网络,通过训练模型调整参数,达到组分识别的目的。但上述几种方法都存在一定的缺陷:特征峰对比法在一些特定场合能有效识别混合物中的成分,但大部分情况下混合物的拉曼光谱谱峰众多,会出现重叠和覆盖的现象,同时由于检测环境复杂、仪器精度较低,拉曼谱峰可能会有偏移,并且特征峰对比法依赖于人眼的判定,较为费时费力。子空间重叠法要求待识别混合物中的所有组分应包含在已知的标准数据库中,当混合物中的待识别成分不在已知数据库中时,算法将无法给出识别结果。神经网络法在训练模型时需要大量的训练样本,同时也较为耗时。
技术实现思路
本专利技术人针对上述问题及技术需求,提出了一种拉曼光谱下基于相似度的混合物组分识别方法,该混合物组分识别方法可以实现快速且无损的组分识别,实现过程简单、识别结果准确。本专利技术的技术方案如下:一种拉曼光谱下基于相似度的混合物组分识别方法,该混合物组分识别方法包括:采集N种纯净物的拉曼光谱,对于每一种纯净物,利用以第一小波为母小波函数的连续小波变换寻找纯净物的拉曼光谱的特征峰并根据特征峰得到纯净物的特征向量组,N为正整数;采集待识别混合物的拉曼光谱,利用以第二小波为母小波函数的连续小波变换寻找待识别混合物的拉曼光谱的特征峰并根据特征峰得到待识别混合物的特征向量组;分别根据待识别混合物的特征向量组和每一种纯净物的特征向量组计算得到待识别混合物和纯净物的相似度,将N个相似度由大到小排序并根据σ准则筛选出M种候选纯净物;对M种候选纯净物的光谱数据作校正处理,利用非负最小二乘拟合待识别混合物的光谱数据和校正后的M种候选纯净物的光谱数据得到各个候选纯净物的拟合系数,选取拟合系数最大的P种候选纯净物作为待识别混合物的组分识别结果。其进一步的技术方案为,第一小波为墨西哥帽小波形式为:第二小波定义为:其进一步的技术方案为,包括m个拉曼光谱的特征峰的纯净物的特征向量组包括m个特征向量,表示为每个特征向量分别对应纯净物的拉曼光谱的一个特征峰,对应于纯净物的第i个特征峰的第i个特征向量包括第i个特征峰的拉曼位移拉曼强度和半高宽i为参数;包括n个拉曼光谱的特征峰的待识别混合物的特征向量组包括n个特征向量,表示为每个特征向量分别对应待识别混合物的拉曼光谱的一个特征峰,对应于待识别混合物的第j个特征峰的第j个特征向量包括第j个特征峰的拉曼位移拉曼强度和半高宽j为参数。其进一步的技术方案为,根据特征峰得到特征向量组,包括:利用斜率比较法对特征峰进行重叠峰的判断,得到单峰和重叠峰的区间,利用Voigt函数对特征峰进行拟合,对单峰区间的特征峰表示如下:对重叠峰区间的特征峰表示为Voigt函数的线性叠加,表示如下:其中,I(λ)表示拉曼位移为λ处的拉曼强度,λc表示谱峰的拉曼位移,Ic表示谱峰的拉曼强度,w表示谱峰的半高宽,θ表示谱峰的高斯-洛伦兹系数,l为重叠峰区间里重叠峰的个数;采用基于Levenberg-Marquardt算法的曲线拟合方法进行谱峰拟合,得到每个特征峰的特征向量,包括特征峰的拉曼位移、拉曼强度和半高宽;将各个特征峰的特征向量按照拉曼位移由小到大的顺序组成特征向量组。其进一步的技术方案为,分别根据待识别混合物的特征向量组和每一种纯净物的特征向量组计算得到待识别混合物和纯净物的相似度,包括对于每一种纯净物:根据纯净物的每一个特征峰的拉曼位移和待识别混合物的每一个特征峰的拉曼位移对纯净物的各个特征峰和待识别混合物的各个特征峰进行峰位匹配,得到k对匹配成功的纯净物特征峰和待识别混合物特征峰;根据每一对匹配成功的纯净物特征峰和待识别混合物特征峰各自的拉曼位移和半高宽计算纯净物特征峰和待识别混合物特征峰的拉曼位移的相似度和半高宽的相似度;根据第a个匹配成功的纯净物特征峰的拉曼强度计算第a个匹配成功的纯净物特征峰的权重,a为参数;其中,a和b为参数,表示第a个匹配成功的纯净物特征峰的拉曼强度,表示第a个匹配成功的纯净物特征峰的权重;根据每一对匹配成功的纯净物特征峰和待识别混合物特征峰的拉曼位移的相似度和半高宽的相似度以及纯净物特征峰的权重计算纯净物和待识别混合物的相似度:其中,S表示纯净物和待识别混合物的相似度,Fa(xa)表示第a对匹配成功的纯净物特征峰和待识别混合物特征峰的拉曼位移的相似度,Fb(ya)表示第a对匹配成功的纯净物特征峰和待识别混合物特征峰的半高宽的相似度。其进一步的技术方案为,根据纯净物的每一个特征峰的拉曼位移和待识别混合物的每一个特征峰的拉曼位移对纯净物的各个特征峰和待识别混合物的各个特征峰进行峰位匹配,包括:对于纯净物的第i个特征峰,检测待识别混合物的各个特征峰中是否存在拉曼位移与第i个特征峰的拉曼位移的差值在谱峰偏移范围内的特征峰,若存在,则确定检测得到的待识别混合物的特征峰和纯净物的第i个特征峰匹配成功;令i=i+1并再次执行检测待识别混合物的各个特征峰中是否存在拉曼位移与第i个特征峰的拉曼位移的差值在谱峰偏移范围内的特征峰的步骤。其进一步的技术方案为,根据每一对匹配成功的纯净物特征峰和待识别混合物特征峰各自的拉曼位移和半高宽计算纯净物特征峰和待识别混合物特征峰的拉曼位移的相似度和半高宽的相似度,包括对于第a对匹配成功的纯净物特征峰和待识别混合物特征峰:计算纯净物特征峰和待识别混合物特征峰的拉曼位移差值,并利用模糊隶属度函数基于拉曼位移差值计算得到纯净物特征峰和待识别混合物特征峰的拉曼位移的相似度:计算纯净物特征峰和待识别混合物特征峰的半高宽差值,并利用模糊隶属度函数基于半高宽差值计算得到纯净物特征峰和待识别混合物特征峰的半高宽的相似度:其中,xa表示第a对匹配成功的纯净物特征峰和待识别混合物特征峰的拉曼位移差值,ya表示第a对匹配成功的纯净物特征峰和待识别混合物特征峰的半高宽差值。其进一步的技术方案为,对M种候选纯净物的光谱数据作校正处理,包括对于每一种候选纯净物:根据候选纯净物的每一个特征峰的拉曼位移和待识别混合物的每一个特征峰的拉曼位移对候选纯净物的本文档来自技高网
...

【技术保护点】
1.一种拉曼光谱下基于相似度的混合物组分识别方法,其特征在于,所述混合物组分识别方法包括:采集N种纯净物的拉曼光谱,对于每一种纯净物,利用以第一小波为母小波函数的连续小波变换寻找所述纯净物的拉曼光谱的特征峰并根据所述特征峰得到所述纯净物的特征向量组,N为正整数;采集待识别混合物的拉曼光谱,利用以第二小波为母小波函数的连续小波变换寻找所述待识别混合物的拉曼光谱的特征峰并根据所述特征峰得到所述待识别混合物的特征向量组;分别根据所述待识别混合物的特征向量组和每一种纯净物的特征向量组计算得到所述待识别混合物和所述纯净物的相似度,将N个相似度由大到小排序并根据σ准则筛选出M种候选纯净物;对所述M种候选纯净物的光谱数据作校正处理,利用非负最小二乘拟合所述待识别混合物的光谱数据和校正后的所述M种候选纯净物的光谱数据得到各个候选纯净物的拟合系数,选取拟合系数最大的P种候选纯净物作为所述待识别混合物的组分识别结果。

【技术特征摘要】
1.一种拉曼光谱下基于相似度的混合物组分识别方法,其特征在于,所述混合物组分识别方法包括:采集N种纯净物的拉曼光谱,对于每一种纯净物,利用以第一小波为母小波函数的连续小波变换寻找所述纯净物的拉曼光谱的特征峰并根据所述特征峰得到所述纯净物的特征向量组,N为正整数;采集待识别混合物的拉曼光谱,利用以第二小波为母小波函数的连续小波变换寻找所述待识别混合物的拉曼光谱的特征峰并根据所述特征峰得到所述待识别混合物的特征向量组;分别根据所述待识别混合物的特征向量组和每一种纯净物的特征向量组计算得到所述待识别混合物和所述纯净物的相似度,将N个相似度由大到小排序并根据σ准则筛选出M种候选纯净物;对所述M种候选纯净物的光谱数据作校正处理,利用非负最小二乘拟合所述待识别混合物的光谱数据和校正后的所述M种候选纯净物的光谱数据得到各个候选纯净物的拟合系数,选取拟合系数最大的P种候选纯净物作为所述待识别混合物的组分识别结果。2.根据权利要求1所述的混合物组分识别方法,其特征在于,所述第一小波为墨西哥帽小波形式为:所述第二小波定义为:3.根据权利要求1所述的混合物组分识别方法,其特征在于,包括m个拉曼光谱的特征峰的所述纯净物的特征向量组包括m个特征向量,表示为每个特征向量分别对应所述纯净物的拉曼光谱的一个特征峰,对应于所述纯净物的第i个特征峰的第i个特征向量包括所述第i个特征峰的拉曼位移拉曼强度和半高宽i为参数;包括n个拉曼光谱的特征峰的所述待识别混合物的特征向量组包括n个特征向量,表示为每个特征向量分别对应所述待识别混合物的拉曼光谱的一个特征峰,对应于所述待识别混合物的第j个特征峰的第j个特征向量包括所述第j个特征峰的拉曼位移拉曼强度和半高宽j为参数。4.根据权利要求3所述的混合物组分识别方法,其特征在于,根据特征峰得到特征向量组,包括:利用斜率比较法对所述特征峰进行重叠峰的判断,得到单峰和重叠峰的区间,利用Voigt函数对特征峰进行拟合,对单峰区间的特征峰表示如下:对重叠峰区间的特征峰表示为Voigt函数的线性叠加,表示如下:其中,I(λ)表示拉曼位移为λ处的拉曼强度,λc表示谱峰的拉曼位移,Ic表示谱峰的拉曼强度,w表示谱峰的半高宽,θ表示谱峰的高斯-洛伦兹系数,l为重叠峰区间里重叠峰的个数;采用基于Levenberg-Marquardt算法的曲线拟合方法进行谱峰拟合,得到每个特征峰的特征向量,包括所述特征峰的拉曼位移、拉曼强度和半高宽;将各个特征峰的特征向量按照拉曼位移由小到大的顺序组成特征向量组。5.根据权利要求3所述的混合物组分识别方法,其特征在于,所述分别根据所述待识别混合物的特征向量组和每一种纯净物的特征向量组计算得到所述待识别混合物和所述纯净物的相似度,包括对于每一种纯净物:根据所述纯净物的每一个特征峰的拉曼位移和所述待识别混合物的每一个特征峰的拉曼位移对所述纯净物的各个特征峰和所述待识别混合物的各个特征峰进行峰位匹配,得到k对匹配成功的纯净物特征峰和待识别混合物特征峰;根据每一对匹配成功的纯净物特征峰和待识别混合物特征峰各自的拉曼位移和半高宽计算所述纯净物特征峰和待识别混合物特征峰的拉曼位移的相似度和半高宽的相似度;根据第a个匹配成功的纯净物特征峰的拉曼强度计算所述第a个匹配成功的纯净物特征峰的权重,a为参数;其中,a和b为参数,表示第a个匹配成功的纯净物特征峰的拉曼强度,表示第a个匹配成功的纯净物特征峰的权重;根据每一对匹配成功的纯净物特征峰和待识别混合物特征峰的拉曼位移的相似度和...

【专利技术属性】
技术研发人员:朱启兵刘财政黄敏郭亚
申请(专利权)人:江南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1