System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 菌群波动相似性的生物分类层级加权叠加计算方法及系统技术方案_技高网

菌群波动相似性的生物分类层级加权叠加计算方法及系统技术方案

技术编号:40205224 阅读:9 留言:0更新日期:2024-02-02 22:17
本发明专利技术属于微生物波动相似性度量技术领域,公开了度量菌群波动相似性的生物分类层级加权叠加方法、系统。该方法包括注释:从较低的分类水平向较高的分类水平逐级推导证据,根据原始信息生成多样化的证据层级;量化:基于收集的原始证据集,对微生物菌群与疾病之间的关系进行可量化式的计算,将微生物数据与疾病之间的关联进行数值化;余弦相似性计算:基于微生物波动情况,计算任意两种疾病在同一层级内微生物波动的余弦相似性;加权相似性确定:基于不同权重和余弦相似性,加权计算最终的相似性。本发明专利技术能够最大化的提高菌群原始数据利用率,更准确地评估不同层级之间的相似性,为微生物研究提供更深入的理解。

【技术实现步骤摘要】

本专利技术属于微生物波动相似性度量,尤其涉及度量菌群波动相似性的生物分类层级加权叠加方法、系统。由于引起菌群波动的因素多样,包括疾病发生、膳食摄入、药物服用等,这里提出的以菌群波动为中介的相似度计算方法可以广泛用于量化上述因素之间的关联关系:疾病与疾病、膳食与疾病、药物与疾病、膳食与膳食、药物与药物、膳食与药物之间的关联等。


技术介绍

1、在过去的10-15年中,对人体微生物群的组成和功能的理解经历了指数增长。现有的微生物检测方法包括16s扩增子测序、qpcr、芯片和宏基因组等。由于测序技术的限制,这些方法在菌群的生物分类层级的检测能力方面存在差异,例如16s扩增子测序可以检测到细菌属的层级,而宏基因组可以检测到种的层级。这导致我们搜集的文献库证据中的菌群信息存在多个生物分类学层级。

2、通过上述分析,现有技术存在的问题及缺陷为:现有的相似性计算方法主要集中在属级别进行研究,或者在多个层级上进行无差别计算,未能准确考虑不同层级之间的相似性。

3、现有技术:目前计算疾病间相似性的分析方法有多种,常用的有基于症状和临床特征的相似性分析,基于遗传信息的相似性分析,基于疾病网络的相似性分析,基于文本挖掘的相似性分析,基于数据驱动的相似性分析。这些方法都具有数据驱动性,且主要是从症状数据,遗传数据或者文本数据,网络数据为出发点,进而推断疾病之间的相似性,从而提供量化的评估。

4、现有技术存在的技术问题:

5、1.出发的角度不同:由于疾病之间的相似性是一个复杂的概念,不同的方法和度量方式可能导致不同的结果。目前较少相似度的计算是从微生物角度出发来度量疾病间的相似性,进而在一定程度对疾病间的并发性有很好的解释性。

6、2.单一层级分析:而少数以微生物为介导来研究疾病间相似性的算法,往往主要在属层级上进行微生物群落的分析,而忽视了微生物在其他分类层级(如门、纲、目、科、种)上的波动,这会丢失一些重要的与疾病关联的信息。

7、3.缺乏层级间的关联性分析:微生物在不同的生物分类层级上的变化存在关联,而现有技术没有对这些层级之间的关联性进行深入的分析。

8、4.简化的微生物与疾病关联度计算:现有技术仅仅利用单一分类层级信息或者多层级无差别计算对微生物与疾病的关联度进行了计算,而没有深入地考虑微生物在不同层级上的波动与疾病之间的具体关联性。

9、5.缺乏综合性相似性度量:现有的技术仅仅计算单一层级的疾病间的相似性,这导致不同层级的微生物信息无法综合利用,而且不同层级的信息也应赋予不同的权重叠加计算为最终的相似性。

10、虽然现有技术对疾病间的相似度进行了计算,但由于其在微生物的生物分类层级分析、微生物与疾病的关联度计算以及综合性相似性度量方面的局限性,无法提供一个全面和深入的基于微生物波动下的疾病间的关联性分析结果。


技术实现思路

1、针对现有技术存在的问题,本专利技术提供了度量菌群波动相似性的生物分类层级加权叠加方法、系统。

2、本专利技术是这样实现的,一种度量菌群波动相似性的生物分类层级加权叠加方法;包括以下步骤:

3、步骤一,注释:将微生物菌群进行层级鉴定,从较低的物种分类水平向较高的分类水平逐级推导证据,根据原始信息生成多样化的证据层级;

4、步骤二,量化:基于收集的原始证据集,对微生物菌群与疾病之间的关系进行可量化式的计算,将微生物数据与疾病之间的关联进行数值化;

5、步骤三,余弦相似性计算:基于微生物波动情况,计算任意两种疾病在同一层级内微生物波动的余弦相似性;

6、步骤四,加权相似性确定:基于不同权重和余弦相似性,加权计算最终的相似性。

7、进一步,所述步骤一收集的微生物波动证据均是细菌界,且分布在6个层级:门纲目科属种;借助于greengenes和silvsar138.1数据库将收集到的证据中的微生物从低层级种往高层级门进行逐级推导,得到每个层级的微生物波动矩阵。

8、进一步,所述步骤二利用步骤一每一层级的矩阵进行如下的量化过程:ri,m=ci,m×ei,m×log(n/ni);

9、其中表示在该疾病i状态下微生物波动的情况,相较于未患病状态:微生物m相对丰度增加,表示为1;相对丰度减少,则表示为-1;ei,m为与该疾病i引起该微生物m波动的相关文献报道的数量;log(n/ni)中n为所有的疾病的数量,ni为引起该微生物m波动的疾病的数量。

10、进一步,所述步骤三通过计算余弦相似性,可以衡量不同层级之间的相似程度,而赋予不同的权重可以根据其显著性调整相似性计算的结果;计算过程如下:

11、经过量化后,每一种疾病i都会得到一个微生物波动的向量xi:

12、xi=(ri,1,ri,2,…,ri,j,…,ri,m);

13、利用余弦相似性对每一个层级的两种疾病之间进行相似性计算:

14、

15、最终,得到每一个层级的疾病两两之间的相似性矩阵。

16、进一步,所述步骤四通过将不同层级之间的余弦相似性加权叠加,可以得到最终的相似性结果,该结果更准确地反映微生物群落与疾病之间的关系。计算过程如下:

17、根据各自的显著性p值结合t分布,得到对应的统计量tij;

18、根据两两疾病间的相似度得到方差:

19、权重则定义为逆方差:

20、得到不同层级的权重后,进行加权叠加得到最终的多层级之间任意两个疾病的最终相似度:其中k代表不同的层级。

21、本专利技术的另一目的在于提供一种度量菌群波动相似性的生物分类层级加权叠加方法的度量菌群波动相似性的生物分类层级加权叠加系统,该系统包括:

22、注释模块,用于从较低的分类水平向较高的分类水平逐级推导证据,根据原始信息生成多样化的证据层级;

23、量化模块,与注释模块连接,用于对微生物菌群与疾病之间的关系进行可量化式的计算,将微生物数据与疾病之间的关联进行数值化;

24、余弦相似性计算模块,与量化模块连接,用于计算任意两种疾病在同一层级内微生物波动的余弦相似性;

25、加权相似性确定模块,与余弦相似性计算模块连接,用于加权计算最终的相似性。

26、本专利技术的另一目的在于提供一种度量菌群波动相似性的生物分类层级加权叠加方法适用于可引发菌群波动的任何因素的应用,适用于基于微生物波动下任意疾病之间、不同膳食纤维之间的相似性计算。

27、进一步,所述应用基于相似性进行聚类,将膳食纤维进行功能分类,同时也可以基于微生物波动相似性对疾病进行分类,在一定程度上可以较好解释疾病间的并发机制,鉴定涉及的关键菌种。另外,也可以计算膳食纤维和疾病之间的微生物波动模式的相似性,为特定疾病人群摄入膳食纤维进行科学的理论指导和合理的饮食搭配。

28、结合上述的技术方案和解决的技术问题,本专利技术所要保护的技术方案所具本文档来自技高网...

【技术保护点】

1.度量菌群波动相似性的生物分类层级加权叠加方法,其特征在于,包括以下步骤:

2.如权利要求1所述的度量菌群波动相似性的生物分类层级加权叠加方法,其特征在于,所述步骤一收集的微生物波动证据均是细菌界,且分布在6个层级:门纲目科属种;借助于Greengenes和SILVSAr138.1数据库将收集到的证据中的微生物从低层级种往高层级门进行逐级推导,得到每个层级的微生物波动矩阵。

3.如权利要求1所述的度量菌群波动相似性的生物分类层级加权叠加方法,其特征在于,所述步骤二利用步骤一每一层级的矩阵进行如下的量化过程:Ri,m=Ci,m×Ei,m×log(N/ni);

4.如权利要求1所述的度量菌群波动相似性的生物分类层级加权叠加方法,其特征在于,所述步骤三通过计算余弦相似性,可以衡量不同层级之间的相似程度,而赋予不同的权重可以根据其显著性调整相似性计算的结果;计算过程如下:

5.如权利要求1所述的度量菌群波动相似性的生物分类层级加权叠加方法,其特征在于,所述步骤四通过将不同层级之间的余弦相似性加权叠加,可以得到最终的相似性结果,该结果更准确地反映微生物群落与疾病之间的关系。计算过程如下:

6.如权利要求1~5任一项所述的一种度量菌群波动相似性的生物分类层级加权叠加方法的度量菌群波动相似性的生物分类层级加权叠加系统,其特征在于,该系统包括:

7.如权利要求1~5任一项所述的一种度量菌群波动相似性的生物分类层级加权叠加方法适用于可引发菌群波动的任何因素的应用,其特征在于,适用于基于微生物波动下任意疾病之间、不同膳食纤维之间或者疾病和膳食纤维间的相似性计算。

8.如权利要求7所述的度量菌群波动相似性的生物分类层级加权叠加方法适用于可引发菌群波动的任何因素的应用,其特征在于,基于相似性进行聚类,将膳食纤维进行功能分类,在一定程度上可有效解释疾病并发性,也可以计算膳食纤维和疾病之间的微生物波动模式的相似性,为特定疾病人群摄入膳食纤维进行科学的理论指导和合理的饮食搭配。

9.如权利要求8所述的度量菌群波动相似性的生物分类层级加权叠加方法,其特征在于,适用于可引发菌群波动的任何因素的应用,所述应用基于相似性进行聚类,将膳食纤维进行功能分类,同时也可以基于微生物波动相似性对疾病进行分类。

...

【技术特征摘要】

1.度量菌群波动相似性的生物分类层级加权叠加方法,其特征在于,包括以下步骤:

2.如权利要求1所述的度量菌群波动相似性的生物分类层级加权叠加方法,其特征在于,所述步骤一收集的微生物波动证据均是细菌界,且分布在6个层级:门纲目科属种;借助于greengenes和silvsar138.1数据库将收集到的证据中的微生物从低层级种往高层级门进行逐级推导,得到每个层级的微生物波动矩阵。

3.如权利要求1所述的度量菌群波动相似性的生物分类层级加权叠加方法,其特征在于,所述步骤二利用步骤一每一层级的矩阵进行如下的量化过程:ri,m=ci,m×ei,m×log(n/ni);

4.如权利要求1所述的度量菌群波动相似性的生物分类层级加权叠加方法,其特征在于,所述步骤三通过计算余弦相似性,可以衡量不同层级之间的相似程度,而赋予不同的权重可以根据其显著性调整相似性计算的结果;计算过程如下:

5.如权利要求1所述的度量菌群波动相似性的生物分类层级加权叠加方法,其特征在于,所述步骤四通过将不同层级之间的余弦相似性加权叠加,可以得到最终的相似性结果,该结果更准确地...

【专利技术属性】
技术研发人员:贾耿介张鑫高飞罗广文
申请(专利权)人:中国农业科学院农业基因组研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1