The invention discloses a weighted microbial clustering analysis method based on microbial mass spectrometer. Firstly, n strains to be clustered are classified as one group, and the similarity distance between classes and classes is calculated according to the prescribed similarity distance of strains. Then, the two classes with the closest similarity distance are merged into a new class, which is transformed into n_1 classes by this process. The process reduces one class recursively at a time until it is finally merged into one class, where n is a natural number greater than or equal to 3. The advantages of the present invention are that the weighted microbial isolation cluster analysis method is superior to the microbial DNA sequence analysis method in cost and classification speed, and is close to the DNA sequence analysis method in accuracy; compared with the existing microbial mass spectrometry cluster analysis method in the industry, the method has obvious advantages in accuracy and operation speed.
【技术实现步骤摘要】
基于微生物质谱仪的加权微生物聚类分析法
本专利技术涉及微生物聚类分析法,尤其是涉及基于微生物质谱仪的加权微生物聚类分析法。
技术介绍
微生物的分类研究已有多年的历史,早期都是根据微生物的生理生化特征、形态特征等表型特征进行的。然而这些表型特征受环境影响较大,没有客观的量化指标,因此并不是稳定的,因此分类的结果具有一定随机性,不能反映微生物间的本质关系。而经过质谱采集得到的表征微生物蛋白质图谱是较为稳定的、且反映微生物的本质特点,行业内将质谱仪采集图谱形象的称为“微生物指纹”。因此,利用菌株间质谱图的差异性来判断它们之间的亲缘关系的远近是一个较为精准的方法。数据挖掘是一种从大量数据中发掘、提取有用的、深层次信息的方法。基于数据挖掘,微生物聚类分析是将具有某种相似性的微生物聚集划分,用来对菌种进行量化分类,在临床应用有较多应用;例如,在得到大量菌株后需要进一步分析菌株的特征,使用聚类分析快速分类后对同一类的菌株只需挑选一个典型的菌株研究,而不需要每一种菌株都研究,这种分类“筛选”大大缩小了研究的工作量。另外,在科研领域也可以用来发现大量菌株数据的潜在关系,与具体应技术相结合对未知菌株进行预测、定性,从而帮助我们从已知功能和结构的菌株推测未知菌株的可能功能和结构,是微生物应用、科研领域必不可少的利器。目前对微生物做聚类分析比较常见的有三种方法:1、根据培养的细菌形态特征、生理生化特征等表型特征进行分类,这种方法受菌株培养环境的影响很大,同时对菌株间的关系缺少客观的量化指标,因此该方法具有较大的随机性,并不能特别准确的反映微生物间的亲缘关系。2、根据微生物DNA序 ...
【技术保护点】
1.一种基于微生物质谱仪的加权微生物聚类分析法,其特征在于:首先将待聚类分析的n个菌株各自作为一类,并按照规定的菌株相似度距离计算类与类之间的相似度距离,然后将所述相似度距离最近的两类合并为一个新类,经过此过程变为n‑1个类;重复递归上述过程,每次递归减少一类,直至最终合并为一个类,其中, n为大于或等于3的自然数。
【技术特征摘要】
1.一种基于微生物质谱仪的加权微生物聚类分析法,其特征在于:首先将待聚类分析的n个菌株各自作为一类,并按照规定的菌株相似度距离计算类与类之间的相似度距离,然后将所述相似度距离最近的两类合并为一个新类,经过此过程变为n-1个类;重复递归上述过程,每次递归减少一类,直至最终合并为一个类,其中,n为大于或等于3的自然数。2.根据权利要求1所述基于微生物质谱仪的加权微生物聚类分析法,其特征在于:所述菌株相似度距离包括菌株之间的相似度距离和菌株类之间的相似度距离;一、所述菌株之间的相似度距离计算:按照一定信噪比阈值选取菌株峰列表的m/z、强度进行计算;首先按照设定误差找到两个菌株图谱中位置相同的峰,对于二维的数据采取三个指标进行融合计算;两个菌株图谱峰位置相同的峰值分别设为(x11,y11)、(x12,y12)…(x1n,y1n),(x21,y21)、(x22,y22)…(x2n,y2n),其中,x表示质量;m/z:测定离子的质荷比,即粒子的质量数与所带的电荷的比值;y表示强度;x1i=x2i;步骤1、皮尔森相关系数:公式(1);公式(2);公式(3);公式(4);公式(5);公式(6);公式(7);步骤2、斯皮尔曼相关系数:公式(8);步骤3、峰值曲线拟合后的切线对比:对图谱峰值点进行插值曲线拟合,对于每个峰值的切线与X轴的夹角设为ɑ,切线相关系数为:公式(9);根据上述相关指标取权重:菌株之间的相似度距离Dist=a×+b×+c×(10)其中:a取0.68,b取0.18,c取0.14;二、所述菌株类之间的相似度距离计算为:计算单个菌株之间的相似度距离,然后采取自底向上的类合并过程;菌株类之间的相似度距离由不同类型的指标按照权重叠加组成,分别是:交叉距离、重心距离、边界距离三种距离按照权重叠加组成;交叉距离:对于两个菌株类、,其中,,...
【专利技术属性】
技术研发人员:肖勇杰,蔡克亚,赵高岭,封松利,
申请(专利权)人:安图实验仪器郑州有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。