A universal Raman spectrum feature extraction method for machine learning material recognition algorithms, involving Raman spectra. The automatic preprocessing of the spectrum; the acquisition of the feature vector of the spectrum. The Raman spectra of any specified range for feature extraction, feature vectors suitable for a variety of machine learning algorithms, strong versatility, is not affected by the target substance or test system; interference noise and fluorescence background can be automatically removed, while preserving the peak signal intensity and position information; can effectively identify included all spectra of target substance; the blank can accurately extract the spectral characteristics, identify and distinguish between positive and negative samples, the actual demand to meet the material detection better; extraction method does not involve complex computation, and less storage space demand, so the low time and space complexity, easy batch processing and analysis used in spectral data.
【技术实现步骤摘要】
用于机器学习物质识别算法的通用拉曼光谱特征提取方法
本专利技术涉及拉曼光谱,尤其是涉及用于机器学习物质识别算法的通用拉曼光谱特征提取方法。
技术介绍
拉曼光谱是以拉曼散射效应为基础的,具有分子指纹信息的振动光谱,每种物质都有区别于其他物质的独特光谱信息。因此,拉曼光谱技术可对物质进行检测分析,在材料、化学、物理、环保和生命科学等领域均有应用。目前流行的表面增强拉曼光谱(SERS)技术[1]和后续发展起来的核壳隔绝纳米粒子增强拉曼光谱(SHINERS)技术[2],大幅度提高了拉曼光谱检测的灵敏度,降低了噪音和背景的干扰,极大地提高了拉曼检测技术的普适性和应用性。基于SERS技术的拉曼光谱仪器具有灵敏度高、样品制备简单、准确度高、检测速度快、成本低和通用性强等优势,因此在痕量物质检测中表现出巨大潜力和广阔的市场前景。例如在食品安全领域中,探测水产品中是否含有孔雀石绿、牛奶中是否含有三聚氰胺和水果表面是否有农药残留等。传统的拉曼谱图识别技术采用与标准谱图进行模板匹配的方法[3],通过相似度阈值判定样本是否含有目标物质。例如文献[4]针对纺织纤维建立各种纯组分纤维的拉曼光谱特征峰表,并将未知样品与该表进行逐一匹配并计算相似度,进而完成快速识别。文献[5]选择光谱特征峰位置上的最大小波系数作为参数,利用简单反向匹配思路计算相似度,简单高效的识别物质。文献[6]对标准品谱图进行编码,然后利用改进的字符串匹配算法将待测谱图的编码与标准编码进行匹配,根据相似度判定样品类别。这类方法通常运用于单纯体系,对未知光谱样本逐一进行物质识别;但由于相邻拉曼峰相互“淹没”的情况时有发 ...
【技术保护点】
用于机器学习物质识别算法的通用拉曼光谱特征提取方法,其特征在于包括以下步骤:1)谱图自动预处理;2)获取谱图的特征向量;3)特征向量的归一化处理。
【技术特征摘要】
1.用于机器学习物质识别算法的通用拉曼光谱特征提取方法,其特征在于包括以下步骤:1)谱图自动预处理;2)获取谱图的特征向量;3)特征向量的归一化处理。2.如权利要求1所述用于机器学习物质识别算法的通用拉曼光谱特征提取方法,其特征在于在步骤1)中,所述谱图自动预处理包括消除噪音和扣除荧光背景。3.如权利要求1所述用于机器学习物质识别算法的通用拉曼光谱特征提取方法,其特征在于在步骤1)中,拉曼光谱样本以二维数据的形式表达,拉曼光谱样本采集往往会受到诸多因素的影响,由激光产生的荧光背景、由射线产生的毛刺峰和仪器的固有噪声。4.如权利要求1所述用于机器学习物质识别算法的通用拉曼光谱特征提取方法,其特征在于在步骤1)中,对拉曼光谱进行准确的物质识别,使用自动的光谱预处理算法,所述自动的光谱预处理算法的主要流程是:(1)搜索原始光谱数据s的局部极大值点;(2)在相邻局部极大值点间使用插值方法,获得荧光背景的估计曲线b;(3)更新光谱数据s=b,对步骤(1)、(2)进行循环迭代;迭代终止条件满足,即可获得荧光背景曲线b,在无人工干预的情况下,采用的谱图自动预处理方法可以准确可靠的消除复杂体系下的拉曼光谱荧光背景,处理异常数据。5.如权利要求1所述用于机器学习物质识别算法的通用拉曼光谱特征提取方法,其特征在于在步骤2)中,所述获取谱图的特征向量采用将峰值信号处理为冲激信号,应用极大极小信号自适应缩放算法,将扣除荧光背景后的光谱的峰值信号处理为冲激信号,所述极大极小信号自适应缩放算法通过极小值和极大值来划分峰信号...
【专利技术属性】
技术研发人员:谢怡,游乔贝,刘国坤,康怀志,曾勇明,孙锡龙,
申请(专利权)人:厦门大学,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。