当前位置: 首页 > 专利查询>江南大学专利>正文

一种基于菌群拉曼特征快速识别样品类别的方法技术

技术编号:36703221 阅读:10 留言:0更新日期:2023-03-01 09:21
本发明专利技术公开了一种基于菌群拉曼特征快速识别样品类别的方法,属于微生物与生态学应用领域。本发明专利技术提供了一种使用拉曼光谱对不同环境微生物群落鉴定的方法,它包括步骤是,先使用外力对环境中细胞培养物进行超微粉碎,然后粉碎后样品使用拉曼光谱检测表征微生物群落的特征,通过不同机器学习分类器可对不同环境样品快速分类,可对未知环境样品进行鉴别。通过本发明专利技术方法结合机器学习可达到快速鉴定微生物环境样品,具有简单可行、适用范围广、可扩展性强等优点。展性强等优点。展性强等优点。

【技术实现步骤摘要】
一种基于菌群拉曼特征快速识别样品类别的方法


[0001]本专利技术涉及一种基于菌群拉曼特征快速识别样品类别的方法,属于微生物与生态学应用领域。

技术介绍

[0002]拉曼光谱(Raman spectra),是一种散射光谱。拉曼光谱分析法是基于印度科学家C.V.拉曼(Raman)所发现的拉曼散射效应,对与入射光频率不同的散射光谱进行分析以得到分子振动、转动方面信息,并应用于分子结构研究的一种分析方法。一般而言,拉曼光谱是特定分子或材料独有的化学指纹。近年来发现,拉曼光谱可应用于生物领域,应用拉曼光谱对单个细胞分析,单个细胞的拉曼光谱是其胞内组分分子振动模式的叠加,由分别对应于一类化学键的拉曼谱峰组成,反映的是单个细胞内代谢物的组成及相对含量的多维信息。单个细胞样品往往是液状菌悬液或滴于拉曼芯片的菌悬液风干样品类型,然后利用显微镜镜下对菌悬液或菌悬液滴于拉曼芯片的风干样品中单个细胞聚焦,针对单个细胞一个一个进行拉曼光谱采集。该技术已在检测单个细胞“胞内组分”、“底物代谢”等领域均取得了一些重要成果。但该技术较少涉及到微生物群落领域。对于来自同一环境样品往往代表着一个微生物群落,针对此复杂微生物样品的拉曼检测需要成千上万个单细胞采集量,才能充分地反映该样品中微生物群落多样性,采集量越大越能完整的表征样品的细胞多样性信息。但这种拉曼光谱检测单细胞的方法耗时耗力,分析数据复杂,大量单细胞数据建立数学建模鉴定分析微生物群落样品类型不易。
[0003]微生物以群落形式广泛存在于自然环境中,环境中存在着庞大而复杂的微生物群落,微生物群落中的微生物细胞对环境变化敏感,外界环境变化通常会导致微生物群落的多样性和群落结构的变化。因此环境变化或人为活动引起的微生物群落组成了不同类型的环境样品,评估环境类型的微生物检测尤为重要,常规对微生物分析多采用高通量16SrRNA和ITS rRNA基因测序得到微生物群落结构,但该方法往往需要较长时间才能得到分析结果,过程复杂,对测试样品要求高,测序成本高,在整体水平、快速表征群落环境样品微生物细胞变化仍然是一大挑战。
[0004]生物大分子多是处在水溶液环境中,研究它们在水溶液中的结构对于了解微生物的结构与性能的关系非常重要。由于水的红外吸收很强,因此用红外光谱研究生物体系有很大局限性,而水的拉曼散射很弱,此外,水分子的拉曼光谱也非常简单,只有为数不多的几个拉曼峰,对于溶解物质的拉曼峰干扰甚小,拉曼光谱是研究水溶液中的生物样品和化学化合物的理想工具,对于细胞内容物如核酸、蛋白质、脂质、糖类、碳水化合物和微量元素等均可生成特定的拉曼光谱。微生物群落是有大量细胞组成,将细胞内容物释放,对细胞主要成分的结构与功能特性的变化测定上拉曼光谱技术比传统化学方法具有更强的优势。此外,通过拉曼谱图不仅可以定性分析被测微生物群落所含成分的组成,还可以定量检测某些成分的含量变化。

技术实现思路

[0005]针对常规分析环境微生物样品的测序成本高、测序速度慢,利用拉曼光谱对环境中微生物单细胞采集信号,收集群落单细胞信息耗时费力等缺点,本专利技术对环境样品的微生物细胞前处理后进行速度更加快速、信息更加完整的拉曼检测,结合机器学习对环境样品类型快速鉴别。
[0006]本专利技术提供了一种基于拉曼光谱的分析环境中微生物群落细胞内代谢以及快速检测鉴定环境样本的方法,其目的在于提供一种快速、可靠、操作简单且能同时获得多种微生物群落特征的方法。其依赖于整个微生物群落细胞内容物的光谱测量,而非微生物群落中单个细胞内容物的组成,以及涉及整合其他基于光测量方法(例如傅里叶红外拉曼光谱)的手段和机器学习方法。该方法可适用于食品、环境地质、海洋的微生物样品分析。
[0007]本专利技术通过对来自环境的微生物样品进行前处理,利用外力破坏细胞膜和细胞壁,使细胞内容物释放出来,以服务于后续的拉曼信号采集;相对于无破坏的环境微生物单细胞拉曼光谱采集方案,本专利技术大大提高针对复杂微生物群落环境样品拉曼光谱的检测时间;同时,本专利技术显著提高了细胞拉曼图谱的信息量,代表了该样品更加丰富的信息。对细胞破坏后的细胞释放内容物,拉曼光谱对微生物群落样品内容物样品检测表现出空间均匀性,拉曼光谱通过机器学习训练足以识别不同样品,将拉曼光谱技术与细胞粉碎技术结合增加了拉曼光谱技术的实用性。
[0008]本专利技术提供了一种用于快速识别样品类别的模型,所述模型是按照下述步骤建立的:
[0009](1)标准样品的收集:
[0010]收集环境样品,将样品离心后收集沉淀,再将沉淀悬浮在无菌水或等渗溶液中,得到悬浮液,将悬浮液离心后,取沉淀,再使用无菌水或等渗溶液重悬,重复至少2次,得到菌悬液;
[0011](2)菌悬液的预处理
[0012]将步骤(1)得到的菌悬液进行细胞破碎,并过滤除去细胞碎片及固体颗粒,得到细胞破碎液;
[0013](3)拉曼光谱检测:
[0014]将步骤(2)得到的细胞破碎液盛于无荧光背景信号的容器中,或直接将步骤(2)得到的细胞破碎液点样于拉曼检测芯片上并风干10~30分钟;使用拉曼平台对无荧光背景信号的容器中的细胞破碎液或拉曼检测芯片上的细胞破碎液进行拉曼光谱的采集,其中,光谱采集条件为:使用532nm激光,扫描光谱范围为500~3750cm
‑1,激光强度为1~300mW,采集时间为1~20s/次,累积次数1次,不同类别样品分别采集50~1000个光谱;
[0015](4)拉曼光谱数据的处理:
[0016]将步骤(3)得到的拉曼光谱数据进行宇宙射线的消除、背景噪音的去除、对基线进行校正处理、Savitzky

Golay平滑并对所有的数据进行归一化处理;
[0017](5)构建模型:
[0018]分别使用K最邻近法(KNN)机器学习算法、支持向量机(SVM)机器学习算法、线性判别降维(LDA)机器学习算法、极致梯度提升(XGBoost)机器学习算法将步骤(4)得到的不同样品类别的拉曼光谱数据进行机器学习,设置训练数据集和检测数据集,其中,训练数据集
为收集数据的70%,检测数据集为收集数据的30%,分类效果最好作为最佳分类器;
[0019]所述K最邻近法(KNN)机器学习算法的参数为:n_neighbors为样品类别数量,algorithm为auto,其他参数为默认值;
[0020]所述支持向量机(SVM)机器学习算法的参数为:核函数为linear,目标函数的惩罚系数C为1000,其他参数为默认值;
[0021]所述线性判别降维(LDA)机器学习算法的参数为:n_components为样品类别数量,其他参数为默认值;
[0022]所述致梯度提升(XGBoost)机器学习算法的参数为:目标函数为multi:softmax,评价指标为merror,其他参数为默认值。
[0023](6)模型的选择
[0024]使用不同模型K最邻近法(KNN)、支持向量机(SVM)、线性判别降维(LDA)、极致梯度提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于快速识别样品类别的模型,其特征在于,所述模型是按照下述步骤建立的:(1)标准样品的收集:收集环境样品,将样品离心后收集沉淀,再将沉淀悬浮在无菌水中,得到悬浮液,将悬浮液离心后,取沉淀,再使用无菌水重悬,重复至少2次,得到菌悬液;(2)菌悬液的预处理将步骤(1)得到的菌悬液进行细胞破碎,并过滤除去细胞碎片及固体颗粒,得到细胞破碎液;(3)拉曼光谱检测:将步骤(2)得到的细胞破碎液置于无荧光背景信号的容器中,或直接将步骤(2)得到的细胞破碎液点样于拉曼检测芯片上并风干;使用拉曼平台对无荧光背景信号的容器中的细胞破碎液或拉曼检测芯片上的细胞破碎液进行拉曼光谱的采集,其中,光谱采集条件为:使用532nm激光,扫描光谱范围为500~3750cm
‑1,激光强度为1~300mW,采集时间为1~20s/次,累积次数1次,不同类别样品分别采集50~1000个光谱;(4)拉曼光谱数据的处理:将步骤(3)得到的拉曼光谱数据进行宇宙射线的消除、背景噪音的去除、对基线进行校正处理、Savitzky

Golay平滑并对所有的数据进行归一化处理;(5)构建模型:分别使用K最邻近法(KNN)机器学习算法、支持向量机(SVM)机器学习算法、线性判别降维(LDA)机器学习算法、极致梯度提升(XGBoost)机器学习算法将步骤(4)得到的不同样品类别的拉曼光谱数据进行机器学习,设置训练数据集和检测数据集,其中,训练数据集为收集数据的70%,检测数据集为收集数据的30%;所述K最邻近法(KNN)机器学习算法的参数为:n_neighbors为样品类别数量,algorithm为auto,其他参数为默认值;所述支持向量机(SVM)机器学习算法的参数为:核函数为linear,目标函数的惩罚系数C为1000,其他参数为默认值;所述线性判别降维(LDA)机器学习算法的参数为:n_components为样品类别数量,其他参数为默认值;所述致梯度提升(XGBoost)机器学习算法的参数为:目标函数为multi:softmax,评价指标为merror,其他参数为默认值;(6)模型的选择使用不同模型K最邻近法(KNN)机器学习算法、支持向量机(SVM)机器学习算法、线性判别降维(LDA)机器学习算法、极致梯度提升(XGBoost)机器学习算法对数据训练后,将得到的检测数据集进行预测,根据真实结果和预测结果得到准确率,准确率最高的模型即为最佳模型,采用最佳模型即可实现对于未知样品的快速鉴别,其中准确率的计算是模型预测正确数量所占总量的比例。2.如权利要求1所述的模型,其特征在于,所述环境样品为含有微生物群落的样品。3.根据权利要求2所述的模型,其特征在于,步骤(1)中所述离心的条件为,离心力可为0~100000
×
g,不为0,时间为0~60min,不为0。4.根据权利要求3所述的模型,其特征在于,步骤(2)中的细胞破碎方式包括:超声、研
磨、反复冻融、高压...

【专利技术属性】
技术研发人员:徐蕾陆震鸣许正宏柴丽娟张晓娟史劲松
申请(专利权)人:江南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1