单细胞拉曼光谱采集数目估计方法、数据处理方法及装置制造方法及图纸

技术编号:32681201 阅读:25 留言:0更新日期:2022-03-17 11:39
本发明专利技术属于数据处理技术领域,公开了一种单细胞拉曼光谱采集数目估计方法、数据处理方法及装置。单细胞拉曼光谱采集数目方法通过根据目标分析物的拉曼光谱信噪比、百分含量和指定阈值计算获得目标分析物被检出的概率值;然后计算拉曼光谱采集数目,从而可以在目标分析物和其它物质的光谱有重叠,即存在背景噪声的情况下,更加合理地计算目标分析物被检出的概率值,进而更加准确地计算拉曼光谱采集数目。单细胞拉曼光谱数据处理方法及装置,则整合了适合分析单细胞拉曼光谱数据的分析流程,并且嵌入了新开发的估计拉曼数据采集数目的方法,可以为用户提供单细胞拉曼光谱分析的半自动化分析平台,可以简化单细胞拉曼光谱分析操作。作。作。

【技术实现步骤摘要】
单细胞拉曼光谱采集数目估计方法、数据处理方法及装置


[0001]本专利技术属于数据处理
,具体涉及一种单细胞拉曼光谱采集数目估计方法、单细胞拉曼光谱数据处理方法及装置。

技术介绍

[0002]拉曼光谱可以无损地获取生物化学物质的特征信息,是一项出色的单细胞分析技术。然而生物分子的拉曼谱带通常是彼此重叠的,此外,细胞是复杂并且动态的生物系统而不是简单的生物化学物质的无序的分布。因此在每一个数据采样点,也就是拉曼成像数据中的每一个像素点(pixel),都有全序列的拉曼光谱,而不是在某一个拉曼波长的拉曼峰值。因此,拉曼成像数据包含了细胞样品中多个生物分子的特征光谱信息。通过数据挖掘分析技术,可以将信息丰富的拉曼光谱成像数据转化为细胞中的生物化学信息,获取拉曼成像数据中无法用单变量分析获得的信息。
[0003]在单细胞拉曼成像过程中,由于拉曼的灵敏度较低,采集拉曼光谱时需要较长时间的曝光,使得数据采集时间增长,有可能需要数小时甚至更长。而长时间的数据采集会导致实验时间过长,也影响细胞动态数据的收集,因此估计分析模型所需要的最小数目的拉曼光本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.单细胞拉曼光谱采集数目估计方法,其特征在于:在采集拉曼成像数据之前做预实验,以收集简单的拉曼数据,根据简单的拉曼数据获取目标分析物的拉曼光谱信噪比;根据用户在操作界面上选择的分析目的,确定对应的指定阈值;当拉曼光谱信噪比小于指定阈值时,根据目标分析物的拉曼光谱信噪比、百分含量以及指定阈值,计算获得目标分析物被检出的概率值;将概率值输入二项分布统计模型,获得拉曼光谱采集数目。2.如权利要求1的单细胞拉曼光谱采集数目估计方法,其特征在于,根据目标分析物的拉曼光谱信噪比、百分含量以及指定阈值,计算获得目标分析物被检出的概率值,包括:通过以下公式计算获得目标分析物被检出的概率值:其中,V
SNR
代表目标分析物的拉曼光谱信噪比,C%代表目标分析物的百分含量,K代表指定阈值,p代表目标分析物被检出的概率值。3.如权利要求1的单细胞拉曼光谱采集数目估计方法,其特征在于:当目标分析物的拉曼光谱信噪比大于或等于指定阈值时,目标分析物被检出的概率值p等于目标分析物的百分含量C%。4.如权利要求1至3任一项的单细胞拉曼光谱采集数目估计方法,其特征在于,根据用户在操作界面上选择的分析目的,为定性分析或定量分析,确定对应的指定阈值,包括:若分析目的为定性分析,对应的指定阈值K为3;若分析目的为定量分析,对应的指定阈值K为10。5.单细胞拉曼光谱数据处理方法,其特征在于,包括以下流程:光谱预处理:对拉曼光谱数据进行预处理,预处理包括去噪音、拉曼尖峰去除、基线平滑和光谱缩放;其中,拉曼光谱数据包括各个拉曼光谱采集点在不同拉曼波长下的拉曼光谱值,拉曼光谱采集点的数量是根据权利要求1至4任一项的拉曼光谱采集数目估计方法而确定的;模式识别:根据用户在操作界面上选择的模式识别目的,通过对应的机器学习方法,对预处理后的拉曼光谱数据进行模式识别,以建立模式识别模型;模型验证:利用交叉验证、置换测试、混淆矩阵和/或接受者操作特性曲线方法,对模式识别模型进行验证。6.如权利要求5的单细胞拉曼光谱数据处理方法,其特征在于,模式识别目的包括细胞可视化分析、细胞分类分析或细胞定量分析,对应于不同的机器学习方法,对预处理后的拉曼光谱数据进行模式识别,以建立模式识别模型:当模式识别目的为细胞可视化分析时,根据用户在操作界面上选择的降维分析方法或者聚类分析方法,对拉曼光谱数据中单细胞内的不同物质进行分类,并根据不同物质的分类信息进行数据重组,获得单细胞的可视化信息,以建立模式识别模型;当模式识别目的为细胞分类分析时,根据用户在操作界面上选择的有监督的机器学习方法,通过光谱信息和细胞分类信息对拉曼光谱数据中多个单细胞进行分类,以建立模式识别模型;或者根据用户在操作界面上选择的无监督的机器学习方法,通过光谱信息对拉
曼光谱数据中多个单细胞进行分类,以建立模式识别模型;当模式识别目的为细胞定量分析时,根据用户在操作界面上选择的有监督的机器学习方法,通过光谱信息和细胞内物质的浓度信息,对各个拉曼光谱采集点的拉曼光谱值进行预...

【专利技术属性】
技术研发人员:刘亚娟余细勇
申请(专利权)人:广州医科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1