微生物群中物种的关联性挖掘方法技术

技术编号:21895812 阅读:30 留言:0更新日期:2019-08-17 16:04
本发明专利技术提供了一种微生物群中物种的关联性挖掘方法,其中所述方法包括:首先,对微生物群落DNA进行高通量测序,计算测序数据得出物种组成和丰度分布;然后,通过Loose Definition方法扩大物种间相关关系候选范围;最后,挖掘间接关系、线性关系和非线性关系。相较于现有技术,本发明专利技术能够更好的还原微生物网络,以便于从系统层面研究微生物共出现网络,为发现关键物种间未知的相关关系做铺垫。

Association Mining Method for Species in Microbial Groups

【技术实现步骤摘要】
微生物群中物种的关联性挖掘方法
本专利技术涉及生物信息
,尤其涉及一种微生物群中物种的关联性挖掘方法及装置。
技术介绍
微生物生活在生物圈的每一个角落,包括土壤、海洋、热泉等等。他们的适应能力非常强,而且无论他们在哪,都是作为一个群落生活在一起的。微生物是生态系统中生物地球化学循环的关键,并且在传统食品等生物技术、饮料制备、以及以基因工程为基础的现代技术都有重要的应用。微生物的研究在过去的十几年里经历了一个转变。宏基因组学,即对一群微生物进行基因组分析,已经成为一种强有力的方法。我们不再主要关注单一培养微生物,而是更多地关注微生物群落,重点分析微生物的种类组成、功能、物种间的相互作用等。在这些研究中,发现和量化物种间的联系是弄清群落的分类和功能结构的最重要的问题。许多微生物通过相互作用而共存,并有效地发挥各种功能(Hurwitz,B.L.,etal.Modelingecologicaldriversinmarineviralcommunitiesusingcomparativemetagenomicsandnetworkanalyses.ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica2014;111(29):10714-10719.)。细菌共出现网络作为分析微生物群落结构的最有用的工具之一,发展的越来越快。它们为研究物种间的相互作用提供了新的方法和生物学见解。然而由于目前对群落结构认识不足,而且宏基因组学数据量也变得越来越大,传统的网络分析不足以恢复细菌群落中的真实关系(Weiss,S.,etal.Correlationdetectionstrategiesinmicrobialdatasetsvarywidelyinsensitivityandprecision.TheISMEjournal2016;10(7):1669-1681.)。在微生物群落中,两个物种之间的关系受到各种各样的影响(例如生态龛位的重叠,两个物种同时受第三个物种的影响),导致微生物网络变得异常复杂。因此,找出复杂而重要的联系(例如,在细菌群落中探索物质或元素的循环过程)对传统方法越来越具有挑战性。
技术实现思路
针对现有技术存在的上述问题,本专利技术实施例提供了一种微生物群中物种的关联性挖掘方法,步骤为:S1采集微生物群DNA样本数据;S2对所述微生物群DNA样本数据进行高通量测序,得到测序数据;S3采用MOthur和Qiime生物信息学工具计算所述测序数据,得出物种组成和丰度分布数据;S4使用LooseDefinition法处理物种组成和丰度分布数据;S5构建相关关系网络;S6利用cytoscape软件进行相关关系网络可视化,使用MCODE聚类来检测潜在的聚类,得到物种相关关系网络图;S7分析相关关系网络图,得出微生物群中物种的关联性。其中,步骤S4具体为:S41将所述物种组成和丰度分布数据转化为二进制数据;S42通过二进制数据,计算共出现概率;S43设定共出现概率的阈值;S44统计共出现概率大于所述阈值的物种,得出物种候选范围。进一步地,步骤S42所述共出现概率为两个物种二进制数据都为1的情况在所有的微生物样本中的占比。进一步地,步骤S43所述共出现概率的阈值为80%。进一步地,步骤S7所述微生物群中物种的关联性包括挖掘间接关系、线性关系和非线性关系中的一种或多种。进一步地,步骤S5所述构建相关关系网络使用FS-Weight方法、PCA-PMI方法、Pearson方法或Spearman方法中的一种或多种。本专利技术以物种共出现网络作为研究对象,基于图论和信息论的相关算法,利用网络分析技术对其进行研究。相比传统方法而言,该方法有以下优点:(1)改进了成对细菌的共出现判定,增加了许多候选的相关关系。(2)该方法用到了图论和信息论的概念,能够挖掘出网络中更复杂的相关关系,而且这些方法都是在生物网络中验证过的,能够挖掘出有意义的生物学关系的方法(3)经过大量文献调研,我们设计了网络分析和比对的流程,保证分析的全面性。(4)利用Meta-Network流程,可以更好的还原微生物群落,能够加深对微生物群落的认识。附图说明图1为本专利技术实施例聚类后的网络图,其中A为实施例4构建的网络,B为实施例1构建的网络,C为实施例2构建的网络,D为实施例2构建的网络中三个紧密结合的网络放大图;图2为本专利技术实施例构建的网络比对图,其中A为实施例4与实施例3的网络比对图,B为实施例3与实施例1的网络比对图,C为实施例3与实施例2的网络比对图,D为实施例1与实施例2的网络比对图;图3为基于Jaccard索引的相似性建树结果图;图4为实施例1-4不同网络的模体分布图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。另外,本专利技术提供的实施例中的技术特征可以相互任意结合,以形成可行的技术方案,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。本专利技术使用Meta-Network来建立物种-物种共出现网络。在进行相关性计算之前,首先引入LooseDefinition(松散定义法)算法,以恢复更多的相关关系。然后利用FS-Weight(功能相似性权重)方法和PCA-PMI(路径一致性算法调整的部分互信息)方法,分别对间接相关和非线性相关进行挖掘。为了研究优化的物种-物种共出现网络的特性,系统性的进行了网络评价,以发现在物种-物种共出现网络中有意义的物种和相关关系。下面结合附图及实施例对本专利技术做进一步的详细说明,实施例仅用于解释本专利技术,而不能解释为对本专利技术的限制。实施例1FS-Weight方法(1)取样、测序在MG-Rast数据库中获取一个编号为MGP15838的健康中国青年人体肠道数据集(该数据集包含314个健康人的肠道菌群16srRNA样本,涵盖了中国7个省份的8个民族的样本),使用物种注释软件QIIME(版本1.91)进行物种注释和相对丰度计算,将得到的物种统计到属水平,并且取在属水平上平均丰度大于0.01%的属进行网络构建。提取DNA,通过高通量测序,生成5,102,015高质量宏基因组序列,利用质量控制软件Mothur对序列进行质量控制,获得24,125个微生物OTUs,并利用物种注释软件QIIME(版本1.91)进行物种注释和相对丰度计算。在属水平上,共鉴定出2,124个属,其中102个属的相对丰度在0.1%以上,685个属的相对丰度在0.01%以上。(2)LooseDefinition算法处理数据,扩大候选范围LooseDefinition算法处理数据(如表1、2、3),将丰度表转化为二进制表,扩大候选相关关系的范围。具体步骤为:1)物种在样本中的丰度(如表1)为0则标记为0,如果丰度不为0便标记为1本文档来自技高网
...

【技术保护点】
1.一种微生物群中物种的关联性挖掘方法,其特征在于,步骤为:S1采集微生物群DNA样本数据;S2对所述微生物群DNA样本数据进行高通量测序,得到测序数据;S3采用MOthur和Qiime生物信息学工具计算所述测序数据,得出物种组成和丰度分布数据;S4使用Loose Definition法处理物种组成和丰度分布数据;S5构建相关关系网络;S6利用cytoscape软件进行相关关系网络可视化,使用MCODE聚类来检测潜在的聚类,得到物种相关关系网络图;S7分析相关关系网络图,得出微生物群中物种的关联性。

【技术特征摘要】
1.一种微生物群中物种的关联性挖掘方法,其特征在于,步骤为:S1采集微生物群DNA样本数据;S2对所述微生物群DNA样本数据进行高通量测序,得到测序数据;S3采用MOthur和Qiime生物信息学工具计算所述测序数据,得出物种组成和丰度分布数据;S4使用LooseDefinition法处理物种组成和丰度分布数据;S5构建相关关系网络;S6利用cytoscape软件进行相关关系网络可视化,使用MCODE聚类来检测潜在的聚类,得到物种相关关系网络图;S7分析相关关系网络图,得出微生物群中物种的关联性。2.如权利要求1所述的微生物群中物种的关联性挖掘方法,其特征在于,步骤S4具体为:S41将所述物种组成和丰度分布数据转化为二进制数据;S42通过二进制数据,计算共出现概率;S43设定...

【专利技术属性】
技术研发人员:宁康杨朋硕余少俊韩毛振
申请(专利权)人:华中科技大学鄂州工业技术研究院华中科技大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1