拉曼成像光谱数据中宇宙射线Spike的识别及修正方法技术

技术编号:18254690 阅读:818 留言:0更新日期:2018-06-20 07:07
本发明专利技术公开一种拉曼成像光谱数据中宇宙射线Spike的识别及修正方法,不再直接用两个光谱的线性近似谱进行比较,而是利用可能包含Spike和小量尖峰信息的目标光谱ss进行比较,减少连续光谱相似度低时为判别Spike带来的干扰,提高了识别的正确率,能有效在拉曼成像数据中集中识别出含有Spike的拉曼光谱并修正。

Identification and correction of cosmic ray Spike in Raman imaging spectral data

The invention discloses a method of recognition and correction of cosmic ray Spike in the Raman spectrum data. It is no longer compared directly with the linear approximation spectrum of two spectra, but is compared with the target spectrum SS which may contain Spike and small peak peak information, and reduces the interference to the Spike when the continuous spectral similarity is low. The accuracy of recognition is improved, and the Raman spectrum containing Spike can be effectively identified in Raman imaging data and corrected.

【技术实现步骤摘要】
拉曼成像光谱数据中宇宙射线Spike的识别及修正方法
本专利技术涉及一种光谱成像处理方法,尤其是涉及一种拉曼成像光谱数据中宇宙射线Spike的识别及修正方法。
技术介绍
拉曼成像技术能提供样品空间上光谱上的信息,有效地提取出样品成分的空间分布信息,被广泛应用生物组织、材料成分分析等领域。耦合电荷器件(CCD)是目前拉曼光谱仪的主要传感器件,具有高灵敏度和低噪声等优点,但却容易受到宇宙射线的干扰,在拉曼光谱上产生狭窄而尖锐的峰,称为Spike。由于宇宙射线的干扰是随机的,所以区别于一般的拉曼特征峰,Spike是随机出现的。拉曼成像技术一次能扫描样品上数千个点,每个样品点都生成一条拉曼光谱,故拉曼成像的数据集包含了样品的数千条拉曼光谱,这些光谱全部拥有相同的波数。在这些光谱中,有一些光谱受到宇宙射线干扰,产生Spike,这些Spike通常强度值很高,若不去除,会对后续的数据处理造成影响。但由于拉曼成像的数据集中包含了太多的拉曼光谱,无法用人眼一一鉴别是否包含Spike,因此需要一种技术在拉曼成像数据集中自动识别包含Spike的光谱,并剔除这些Spike。在拉曼光谱中去除Spike的现有技术可以分为两种,一种是只利用单一光谱的信息去除Spike的方法。另一种是需要利用多个光谱,通过比较光谱之间差异来识别、剔除Spike的方法。单一拉曼光谱修正方法主要依靠Spike峰宽窄,强度高的特点,比较典型的有中值滤波,小波转换。这些方法基于Spike峰宽远小于正常拉曼峰宽的假设,而现有文献报道某些Spike的峰宽高达10个波数;另外中值滤波,小波转换这两种方法会对正常拉曼峰造成一定的扭曲。如上文提及,Spike最重要的特征是其随机性,不可重现这一点,单一拉曼光谱修正Spike方法仅依靠峰宽和峰值强度作为判断Spike的依据,有将正常拉曼峰误判为Spike或遗漏识别Spike的可能——因为有可能出现峰宽狭窄的拉曼峰或峰值强度很小的Spike。这是单一拉曼光谱修正Spike方法的先天不足之处,单条光谱不能提供识别Spike的充分信息。多拉曼光谱修正Spike方法,考虑到Spike出现的随机性,克服单一拉曼光谱修正方法缺点是比较两个相似的光谱,比如使用于连续光谱扫描的最近邻比较法,需要提供额外目标光谱的上界光谱法,一阶、二阶差分,利用矩阵理论,如PCA(principalcomponentanalysis)进行分析的方法。其中最近邻比较法的主要问题是不能保证两个连续的光谱在拉曼峰位置足够相似,峰值过大的差异会造成误判,上界光谱法需要提供在相同条件下测量的目标光谱,显然不是一种实际的办法;基于PCA的方案则要保证光谱矩阵的主要信息不被丢失,但实际上各个光谱主成分的关系复杂,在去除噪声和Spike时,难免会损失一部分有用的信息。
技术实现思路
本专利技术的第一目的在于提供一种拉曼成像的光谱数据中宇宙射线Spike的识别方法,能提高识别正确率。本专利技术的第二个目的在于提供一种从拉曼成像的光谱数据中宇宙射线Spike的修正方法。可以正确识别出整个拉曼成像光谱中含有的全部宇宙射线Spike并去除。本专利技术第一目的可通过以下技术措施来实现:一种拉曼成像的光谱数据中宇宙射线Spike的识别方法,包括以下步骤:1.拉曼成像中生成了m个原始拉曼光谱s,每个光谱有n个波数,对其中一个原始拉曼光谱s执行半窗口值为w的开运算,得到开运算光谱so,半窗口值w取值应不小于拉曼光谱仪产生的最大的Spike峰宽的一半;2.用原始拉曼光谱s每个波数的强度值减去开运算光谱so对应波数的强度值,得到比较光谱sc,即sc=s-so,再对比较光谱sc执行半窗口值为6的膨胀运算,得光谱sc',再用光谱sc'中每个波数的强度值减去该光谱sc'所有强度值的最小值,得到目标光谱ss;3.重复步骤1~2,得到与m个原始拉曼光谱s对应的m个开运算光谱so,m个比较光谱sc和m个目标光谱ss;4.求第i个和第i-1个目标光谱ss的夹角的余弦值cos<ssi-1,ssi>,计算公式为为:式中<ssi-1,ssi>表示ssi-1和ssi的内积,||ssi-1||表示ssi-1的二范数;5.若cos<ssi-1,ssi>小于第一阈值th1,则第i个拉曼光谱si疑似含有Spike;6.对步骤(5)中第i个拉曼光谱si进一步确认Spike的存在,将比较光谱sci第j个波数处的强度值记为sci(j),遍历全部n个波数,找到使得第i个比较光谱sci和第i-1个比较光谱sci-1强度值之差取得最大值的第k个波数,即:7.若sci(k)的强度值大于第二阈值th2,则判定原始光谱si在第k个波数附近出现了Spike,其中th2设定为sci的平均值加上4倍的sci标准差,公式为:本专利技术中第一阈值th1的取值范围为0.8~0.3,th1取值偏大有助于识别强度微弱的Spike但会增加误判的可能,而th1取值偏小可能遗漏Spike的识别,若拉曼光谱之间的连续性好,即连续得到的两个拉曼光谱形态非常相似,可采用偏大的th1,反之应采用偏小的th1。本专利技术第二目的可通过以下技术措施来实现:一种拉曼成像数据中宇宙射线Spike的修正方法,按上述识别方法,取i值为2,即从第2个原始光谱S2开始判断是否有Spike,如没有,则继续按序识别下一个原始光谱S3;如有,则去除当前宇宙射线Spike进行修正,并用修正后的原始光谱S2重新计算比较光谱sc2和目标光谱ss2,用作第3个原始光谱S3的识别;依次重复,除第一个原始光谱外,其它m-1个原始光谱中集中判定出所含有Spike的光谱。而第一个原始光谱,不对其进行Spike的识别,或设定不存在Spike。上述去除当前宇宙射线Spike的具体过程:将上述判定出现了Spike的原始光谱si第k个波数前后w处的强度值:si(j+r),r=-w,...,w;一共2w+1个强度值替换为开运算光谱soi对应的强度值;若k处于光谱的开头或末尾,不足2w+1个强度值,忽视那些超过开头或末尾的部分,完成强度值的替换后获得去除当前Spike的修正后的拉曼光谱。本专利技术具有以下技术效果:本专利技术技术方案不再直接用两个光谱的线性近似谱进行比较,而是利用可能包含Spike和小量尖峰信息的目标光谱ss进行比较,减少连续光谱相似度低时为判别Spike带来的干扰,提高了识别的正确率,能有效在拉曼成像数据中集中识别出含有的全部Spike,并对拉曼光谱进行修正。附图说明图1异常光谱的位置信息,图(a)~(d)分别对应第2748~2751条光谱的cos<ssi-1,ssi>值,图中的虚线为y=0.75,图(a)~(d)中标注的四个点均在虚线以下,有存在Spike的可能。图2比较光谱sc2747和sc2748,其强度值在1024cm-1差异明显。图3(a)第2748~2751条原始拉曼光谱,这四条连续的光谱均在波数1042cm-1的位置出现Spike;(b)修复后的第2748~2751条拉曼光谱。图4连续得到两条信号较弱的拉曼光谱s1和s2,光谱s2在波数1238cm-1的位置出现低强度的Spike;图5目标光谱ss2和ss1,目标光谱ss2保留了Spike的特征。图6连续得到两条拉曼光谱sa和sb,在拉曼峰本文档来自技高网
...
拉曼成像光谱数据中宇宙射线Spike的识别及修正方法

【技术保护点】
1.一种拉曼成像光谱数据中宇宙射线Spike的识别方法,其特征在于包括以下步骤:步骤1:拉曼成像中生成了m个原始拉曼光谱s,每个光谱有n个波数,对其中一个原始拉曼光谱s执行半窗口值为w的开运算,得到开运算光谱so,半窗口值w取值应不小于拉曼光谱仪产生的最大的Spike峰宽的一半;步骤2:用原始拉曼光谱s每个波数的强度值减去开运算光谱so对应波数的强度值,得到比较光谱sc,即sc=s‑so,再对比较光谱sc执行半窗口值为6的膨胀运算,得光谱sc',再用光谱sc'中每个波数的强度值减去该光谱sc'所有强度值的最小值,得到目标光谱ss;步骤3:重复步骤1~2,得到与m个原始拉曼光谱s对应的m个开运算光谱so,m个比较光谱sc和m个目标光谱ss;步骤4:求第i个和第i‑1个目标光谱ss的夹角的余弦值cos<ssi‑1,ssi>,计算公式为为:

【技术特征摘要】
1.一种拉曼成像光谱数据中宇宙射线Spike的识别方法,其特征在于包括以下步骤:步骤1:拉曼成像中生成了m个原始拉曼光谱s,每个光谱有n个波数,对其中一个原始拉曼光谱s执行半窗口值为w的开运算,得到开运算光谱so,半窗口值w取值应不小于拉曼光谱仪产生的最大的Spike峰宽的一半;步骤2:用原始拉曼光谱s每个波数的强度值减去开运算光谱so对应波数的强度值,得到比较光谱sc,即sc=s-so,再对比较光谱sc执行半窗口值为6的膨胀运算,得光谱sc',再用光谱sc'中每个波数的强度值减去该光谱sc'所有强度值的最小值,得到目标光谱ss;步骤3:重复步骤1~2,得到与m个原始拉曼光谱s对应的m个开运算光谱so,m个比较光谱sc和m个目标光谱ss;步骤4:求第i个和第i-1个目标光谱ss的夹角的余弦值cos<ssi-1,ssi>,计算公式为为:式中<ssi-1,ssi>表示ssi-1和ssi的内积,||ssi-1||表示ssi-1的二范数;步骤5:若cos<ssi-1,ssi>小于第一阈值th1,则第i个拉曼光谱si疑似含有Spike;步骤6:对步骤(5)中第i个拉曼光谱si进一步确认Spike的存在,将比较光谱sci第j个波数处的强度值记为sci(j),遍历全部n个波数,找到使得第i个比较光谱sci和第i-1个比较光谱sci-1强...

【专利技术属性】
技术研发人员:张沃伦郭周义刘智明钟会清庄正飞
申请(专利权)人:华南师范大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1