一种基于“HCA+”的菌落拉曼光谱快速挑选方法技术

技术编号:38462886 阅读:6 留言:0更新日期:2023-08-11 14:39
本发明专利技术提供一种基于“HCA+”的菌落拉曼光谱快速挑选方法,使用拉曼光谱技术和无监督聚类方法,根据不同聚类方法对菌落拉曼光谱适应性上的互补关系,以更少的挑取次数实现更多的混合样品菌落挑取方案;相较于传统基于形态筛选方法或在此基础上的衍生方法,本发明专利技术基于菌落拉曼光谱对菌落进行“指纹级”检测,实现菌落更精准的识别,相较于传统挑菌过程中无偏差挑选菌落,本发明专利技术能够显著缩短挑菌耗时,兼顾挑菌全面、准确的前提下,提升菌落挑选效率;本发明专利技术为菌落检测提供了一种新的快速挑选方法,以提高菌落挑选效率,方法设计科学简洁,适合推广。广。广。

【技术实现步骤摘要】
一种基于“HCA+”的菌落拉曼光谱快速挑选方法


[0001]本专利技术涉及菌落鉴定
,尤其是一种基于“HCA+”的菌落拉曼光谱快速挑选方法。

技术介绍

[0002]菌落检测、鉴定是细菌研究的重要一环,常规细菌鉴定包括形态、生理、生化、遗传特征,这种鉴定的目标通常是分纯培养的单克隆菌落;研究人员通过对菌落形态(如大小、形态、色泽、透明度、致密度和边缘)等的表征挑选感兴趣的菌落,然后进行鉴定或其他研究。
[0003]现实中,不同来源微生物有可能具有相似的菌落形态,因此以种属无偏差挑选微生物菌落为目标的工作,往往并不能高效进行,这种问题在采样量大时尤为突显。
[0004]菌落拉曼光谱是菌落的指纹图谱,蕴含着菌落在特定生理状态下丰富的表型信息,拉曼光谱技术有无标记、不破坏样品的优势,本方法基于菌落拉曼光谱,为挑选菌落提供了新的挑选方法,来帮助研究人员对菌落快速挑选乃至明确具体菌落种属,这一方法极大提高菌落挑选效率,缩短细菌研究流程和周期。

技术实现思路

[0005]为了克服现有技术的不足,本专利技术提供了一种基于“HCA+”的菌落拉曼光谱快速挑选方法,极大提高了微生物菌落团挑选效率和采样特异性,降低了获取特定微生物的时间。
[0006]本专利技术解决其技术问题所采用的技术方案是:一种基于“HCA+”的菌落拉曼光谱快速挑选方法,包括:
[0007]步骤一:菌落拉曼光谱信息输入;
[0008]将菌落拉曼光谱信息输入到光谱投影模块和“HCA+”挑菌方案模块;
[0009]作为一种举例说明,所述菌落拉曼光谱信息包括:菌落培养皿信息以及菌落信息等。
[0010]作为一种举例说明,所述菌落培养皿信息包括:培养皿编号、培养皿菌落数量以及培养皿菌落坐标等。
[0011]作为一种举例说明,所述菌落培养皿信息还包括:菌落编号、菌落提取位置坐标以及菌落挑取位置采集拉曼光谱数量等。
[0012]步骤二:光谱投影,菌落分布可视化;
[0013]将输入的所述菌落拉曼光谱信息进行光谱投影;
[0014]进一步的,所述光谱投影前,先进行光谱预处理和位移校准处理,包括如下操作:
[0015]Step1:光谱预处理;
[0016]首先,对每个菌落的拉曼光谱去除宇宙射线;
[0017]其次,对每个菌落的拉曼光谱进行自适应的基线校正;
[0018]最后,对每个菌落的拉曼光谱进行标准化处理,以实现光谱强度的无量纲化处理;
[0019]作为一种举例说明,所述去除宇宙射线可采用:中值拟合算法和/或二阶差分求导方法。
[0020]作为一种举例说明,所述自适应的基线校正可采用:自适应迭代重加权惩罚最小二乘算法(Adaptive Iterative Re

weighted Penalized Least Squares,airPLS)和/或ALS交替最小二乘算法(alternating least squares,ALS)。
[0021]作为一种举例说明,所述标准化处理包括:规范化方法和/或归一化方法,将光谱投影到[0,1]之间。
[0022]Step2:位移校准处理;
[0023]首先,判断、截取菌落拉曼光谱的拉曼位移交集区域;
[0024]然后,对所述交集区域的光谱进行拟合并插值,保证输入菌落拉曼光谱在相同位移下具有相同的光谱分辨率;
[0025]作为一种举例说明,所述拟合并插值操作包括:多项式拟合插值和/或样条插值。
[0026]Step3:光谱投影;
[0027]对经过光谱预处理和位移校准处理后的菌落光谱数据进行非线性降维,包括:
[0028]首先,将高维空间中任意两个菌落拉曼光谱数据的空间距离转换为相似性概率;
[0029]然后,用高维空间数据点与相应低维空间的模拟数据点之间的概率替换随机邻域嵌入的条件概率,并在低维空间中使用分布策略,缓解低维空间中数据点拥挤问题;
[0030]作为一种举例说明,所述空间距离包括:欧氏距离、曼哈顿距离、闵氏距离或信息熵中的一种或组合。
[0031]作为一种举例说明,所述分布策略为:t分布和/或正态分布。
[0032]步骤三:“HCA+”挑菌方案;
[0033]1.“HCA”部分;
[0034]输入:
[0035](1)菌落拉曼光谱数据集:D={x
11
,x
12
,...,x
ab
},a表示菌落个数,b表示每个菌落采集拉曼光谱数,数据集个数n=a
×
b;
[0036](2)聚类个数为K1,K1≤a;
[0037](3)菌落挑选阈值为N1,N1≤b;
[0038](4)菌落拉曼光谱空间距离度量
[0039]其中:p、q是两个菌落光谱空间位置;
[0040]输出:
[0041]挑取菌落编号集合:C
t
={C
NO.1
,C
NO.1
,...,C
NO.t
};
[0042]聚类过程:初始化聚类个数n=count,count用于控制聚类循环迭代次数,即,每个菌落中的拉曼光谱独立设为一个簇C
i
,其中:i=1,2,...,n;
[0043]Step1:合并当前聚类个数中距离最小的两个簇;
[0044]Step2:合并后聚簇重新编号,并计算新编号与其他簇之间的距离;
[0045]Step3:count=count

1,重复Step1

2,直到count=K1时,结束迭代过程,输出当前聚类结果
[0046]根据当前聚类结果,调整K1值,重新执行步骤Step1

3;
[0047]Step4:统计簇内C
i
每个菌落光谱个数,并从大到小排序,判断最大菌落光谱个数是否大于等于N1,满足则将该最大菌落编号C
NO.i
存储到C
t
集合中,否则,遍历下一个聚类簇,直到遍历完所有K1个聚类簇;
[0048]根据当前C
t
统计结果,调整N1值,重新执行步骤Step4,确定“HCA”部分最终C
t

[0049]2.“+”部分,包括如下步骤:
[0050]输入:
[0051](1)菌落拉曼光谱数据集:D;
[0052](2)聚类个数K2,K2≤a;
[0053](3)菌落挑选阈值N2,N2≤b;
[0054](4)“HCA”输出的挑取菌落编号集合C
t

[0055]输出:挑取菌落编号集合C
t
={C
NO.1
,C
NO.1
,...,C
NO.t
};
[0056本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于“HCA+”的菌落拉曼光谱快速挑选方法,其特征在于,包括:步骤一:菌落拉曼光谱信息输入;将菌落拉曼光谱信息输入到光谱投影模块和“HCA+”挑菌方案模块;步骤二:光谱投影,菌落分布可视化;将输入的所述菌落拉曼光谱信息进行光谱投影;步骤三:“HCA+”挑菌方案;“HCA”部分;输入:

菌落拉曼光谱数据集:D={x
11
,x
12
,...,x
ab
},a表示菌落个数,b表示每个菌落采集拉曼光谱数,数据集个数n=a
×
b;

聚类个数为K1,K1≤a;

菌落挑选阈值为N1,N1≤b;

菌落拉曼光谱空间距离度量其中:p、q是两个菌落光谱空间位置;输出:挑取菌落编号集合:C
t
={C
NO.1
,C
NO.1
,...,C
NO.t
};聚类过程:初始化聚类个数n=count,count用于控制聚类循环迭代次数,即,每个菌落中的拉曼光谱独立设为一个簇C
i
,其中:i=1,2,...,n;Step1:合并当前聚类个数中距离最小的两个簇;Step2:合并后聚簇重新编号,并计算新编号与其他簇之间的距离;Step3:count=count

1,重复Step1

2,直到count=K1时,结束迭代过程,输出当前聚类结果根据当前聚类结果,调整K1值,重新执行步骤Step1

3;Step4:统计簇内C
i
每个菌落光谱个数,并从大到小排序,判断最大菌落光谱个数是否大于等于N1,满足则将该最大菌落编号C
NO.i
存储到C
t
集合中,否则,遍历下一个聚类簇,直到遍历完所有K1个聚类簇;根据当前C
t
统计结果,调整N1值,重新执行步骤Step4,确定“HCA”部分最终C
t
;“+”部分,包括如下步骤:输入:

菌落拉曼光谱数据集:D;

聚类个数K2,K2≤a;

菌落挑选阈值N2,N2≤b;
④“
HCA”输出的挑取菌落编号集合C
t
;输出:挑取菌落编号集合C
t
={C
NO.1
,C
NO.1
,...,C
NO.t
};聚类过程:S1:选取非“HCA”距离度量dist(p,q)的聚类方法,对菌落拉曼光谱数据集进行聚类统计,根据统计结果,调整K2值,重新调整聚类结果;S2:统计每个聚类簇内每个菌落光谱个数,从大到小排序,判断最大菌落光谱个数是否
大于等于N2,满足则判断该最大菌落编号C
NO.i

【专利技术属性】
技术研发人员:李新立洪喜赵银苹刘闯张凯凯
申请(专利权)人:长光辰英杭州科学仪器有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1