一种粪便微生物多样性的自动化分析方法技术

技术编号:27979762 阅读:38 留言:0更新日期:2021-04-06 14:15
本发明专利技术涉及微生物领域,且公开了一种粪便微生物多样性的自动化分析方法,包括原始下机数据过滤和质量控制、宿主基因组比对、微生物菌群物种注释和比对、微生物菌群代谢潜能分析、微生物多样性分析、结果统计和输出等步骤。所有步骤使用Python脚本连接实现自动化分析,减少了繁琐的人工操作,降低了人工操作带来的各种错误,方法在计算了香农多样性指数和辛普森多样性指数的同时,也分析出了样本中的不同微生物菌群的丰度和代谢通路等信息,有助于更加全面地了解粪便微生物多样性,流程在运行时不仅会输出各步骤产生的中间结果,也会对相应的数据做统计分析及整理,输出相应的图表,方便使用者的浏览,同时流程运行日志记录所有流程相关信息,方便在流程运行出错时进行筛查。

【技术实现步骤摘要】
一种粪便微生物多样性的自动化分析方法
本专利技术涉及微生物领域,具体为一种粪便微生物多样性的自动化分析方法。
技术介绍
粪便微生物即从生物粪便中提取分离的所有微生物,也指肠道菌群微生物,这类微生物数量庞大种类众多,在依靠肠道生活的同时,也帮助宿主完成多种生理生化功能。人类的肠道不仅是消化吸收的重要场所,同时也是免疫系统的一部分,可在维持正常免疫防御功能中发挥极为重要的作用,因此人类的肠道微生物还具有人体自身不具备的代谢功能。人类粪便微生物中超过99%的组成部分是细菌,数量约1011个,种类超过1000种,其中97%为厌氧菌、3%为好氧菌。根据微生物菌群功能可分为有益菌、有害菌和中性菌,机体健康与其中的有益菌结构种类息息相关,粪便微生物中不同菌群之间、菌群与宿主之间、菌群宿主与环境之间始终处于动态平衡状态,当这种平衡出现失衡状态,宿主将表现出患病。研究指出,体魄健康的人粪便或肠道有益菌的比例达到70%,普通人则是25%,便秘人群减少到15%,而癌症病人仅有10%或更低。这些微生物菌群组成和多样性大多反映了个体的健康状态,菌群失衡和多样性降低可能与结直肠癌、腹泻、炎症性肠炎、慢性代谢性疾病等的发生发展都有直接或间接的关系,因此维持粪便微生物或肠道微生物菌群结构的健康平衡状态,对于个体健康具有重大意义。近年来,以细菌核糖体RNA序列(16SrRNA)分析为基础的微生物研究技术迅速发展,通过对粪便中分离出的细菌分类和进化标记基因16SrRNA基因进行测序,全面深入地反映环境微生物群落结构的多样性。获取了这些粪便微生物的基因序列后,研究其基因序列对应的功能就成了粪便肠道微生物生态研究的另一个重要方向,其中主要的技术是以序列分析为基础的宏基因组学(Metagenomics)方法,宏基因组指的是环境中全部微生物基因组的总和。在宏基因组学研究中,借助于大规模序列分析,结合生物信息学工具,能够发现大量过去无法得到的未知微生物的新基因,这对了解微生物区系组成、代谢特点、挖掘具有应用潜力的新基因等都有重要意义。基于宏基因组测序的微生物分析过程一般包括原始数据质控、序列比对、物种注释分析、相关丰度鉴定等,在获取菌群相关丰度后根据研究内容再进行下游分析。数据质控常用软件是Trimmomatic软件,修剪去除原始数据中的接头(Adapter)和低质量序列;序列比对常使用Bowtie2软件对比人类基因组参考序列,并去除比对上的序列,剩余序列即为微生物组序列,其他常见软件还包括SOAP、BWA、Martin等;物种注释分析即将与人类基因组比对过滤后的数据和菌群参考基因组再次进行比对及注释,最后根据物种分类信息对丰度进行统计,常用的注释且带有统计功能的软件有MetaPhlAn2、Kraken、Genometa等。对于微生物多样性的描述常使用香农多样性指数(ShannonWienerindex)和辛普森多样性指数(Simpson'sdiversityindex),二者都可以反映整体中具有不同类型个体的种类数量,并且同时考虑到了不同种类的个体分布之间的系统性关系。辛普森多样性指数是从概率的角度描述从一个整体中连续两次抽样所得到的个体属于同一种类的概率,指数值越大,多样性越低,但是辛普森指数受种类的均匀度影响,且重视主要种类、忽视稀有种类;香农多样性指数是从信息论的角度出发,描述不同种类的个体出现的紊乱和不确定性,因此香农多样性指数越高,个体出现的不确定性越高,多样性越高。随着高通量测序成本的下降,测序数据的增多和信息分析需求增大,需要快速从粪便微生物的宏基因组测序结果中分析出微生物多样性。公开号为CN107832584A的中国专利公开了宏基因组的基因分析方法、装置、设备及存储介质,该方法包括对接收的每组测序数据进行筛选和组装,生成测序数据对应的组装数据,通过对组装数据进行基因预测,生成每组测序数据的预测基因,根据预测基因构建基因字典,根据基因字典中每条基因的丰度对基因字典进行聚类,根据聚类后的基因簇对筛选后的每组测序数据进行分类和组装,生成并输出宏基因组的基因等步骤。该方法的优势在于避免了参考基因组带来的局限性,但是该方法的分析终点为微生物宏基因组的基因序列,缺少更多的下游分析,后续计算微生物多样性也需要其他步骤完成。公开号为CN109741790A的中国专利公布了微生物二代测序数据的宏基因组分析方法及系统,该方法包括聚类微生物基因组二代测序数据、标准化处理OTUs表数据、将标准化处理后的OTUs表数据映射到宏基因组功能、统计分析不同宏基因组功能的基因丰度差异四个步骤。该方法的优势在于着重于宏基因组基因功能的分析,但是该方法缺少上游对微生物宏基因组数据的过滤质控和下游针对微生物多样性的相关分析。目前尚无一种自动化分析粪便微生物宏基因组并计算其多样性的方法,因此,设计一种粪便微生物多样性的自动化分析方法,该方法使用粪便微生物宏基因组测序下机数据,自动化完成数据质控、序列比对、物种注释、丰度鉴定和多样性计算等分析,并对结果进行统计、归类和整理,具有现实意义和良好的应用前景。
技术实现思路
针对上述
技术介绍
中的不足,本专利技术提供了一种粪便微生物多样性的自动化分析方法,即使用Python语言编写的脚本将需要使用的软件和对应的计算串联起来,并进行结果统计和多样性分析等操作,自动化进行粪便微生物宏基因组分析,输出中间结果的同时对数据进行分析整理和统计,并记录完备的流程运行日志,不仅自动化分析出粪便微生物的多样性,还避免了人工原因导致的错误,同时完备的流程运行日志也便后续查错纠错。为实现上述目的,本专利技术提供如下技术方案:一种粪便微生物多样性的自动化分析方法,其特征在于,包括如下步骤:步骤1)原始下机数据过滤和质量控制:使用Python脚本进行原始数据的过滤,调用Trimmomatic软件去除接头序列和低质量序列,同时将质控结果输出到单独的文件夹中;步骤2)宿主基因组比对:使用Python脚本调用Bowtie2软件将质控后的序列数据与宿主基因组比对,与宿主基因组比对的同时计算并记录宿主DNA的含量,并将其从质控后的序列中去除;步骤3)微生物菌群物种注释和比对:使用Python脚本调用MetaPhlAn2软件对去除宿主DNA的序列进行和参考序列的比对注释并统计;步骤4)微生物菌群代谢潜能分析:使用Python脚本调用Humann2软件对微生物宏基因组数据进行菌群的代谢潜能分析,计算分析功能基因和代谢通路的组成;步骤5)微生物多样性分析:使用Python编写的多样性计算脚本计算微生物香农多样性指数和辛普森多样性指数;步骤6)结果统计和输出:使用Python脚本统计上述步骤中的结果文件,包括质控结果、人类DNA含量、菌群相对丰度、功能基因相对丰度、代谢通路相对丰度、微生物多样性指数等,并将详细信息整理至输出文件夹,同时将各步骤的中间数据和流程的最终结果整理至输出文件夹中。优选的,所述步骤使用同一个Python脚本进行串联,使用统一的输入参数,运行脚本后可直接进行比对、分析、统计、整理本文档来自技高网
...

【技术保护点】
1.一种粪便微生物多样性的自动化分析方法,其特征在于,包括如下步骤:/n步骤1)原始下机数据过滤和质量控制:使用Python脚本进行原始数据的过滤,调用Trimmomatic软件去除接头序列和低质量序列,同时将质控结果输出到单独的文件夹中;/n步骤2)宿主基因组比对:使用Python脚本调用Bowtie2软件将质控后的序列数据与宿主基因组比对,与宿主基因组比对的同时计算并记录宿主DNA的含量,并将其从质控后的序列中去除;/n步骤3)微生物菌群物种注释和比对:使用Python脚本调用MetaPhlAn2软件对去除宿主DNA的序列进行和参考序列的比对注释并统计;/n步骤4)微生物菌群代谢潜能分析:使用Python脚本调用Humann2软件对微生物宏基因组数据进行菌群的代谢潜能分析,计算分析功能基因和代谢通路的组成;/n步骤5)微生物多样性分析:使用Python编写的多样性计算脚本计算微生物香农多样性指数和辛普森多样性指数;/n步骤6)结果统计和输出:使用Python脚本统计上述步骤中的结果文件,包括质控结果、人类DNA含量、菌群相对丰度、功能基因相对丰度、代谢通路相对丰度、微生物多样性指数等,并将详细信息整理至输出文件夹,同时将各步骤的中间数据和流程的最终结果整理至输出文件夹中。/n...

【技术特征摘要】
1.一种粪便微生物多样性的自动化分析方法,其特征在于,包括如下步骤:
步骤1)原始下机数据过滤和质量控制:使用Python脚本进行原始数据的过滤,调用Trimmomatic软件去除接头序列和低质量序列,同时将质控结果输出到单独的文件夹中;
步骤2)宿主基因组比对:使用Python脚本调用Bowtie2软件将质控后的序列数据与宿主基因组比对,与宿主基因组比对的同时计算并记录宿主DNA的含量,并将其从质控后的序列中去除;
步骤3)微生物菌群物种注释和比对:使用Python脚本调用MetaPhlAn2软件对去除宿主DNA的序列进行和参考序列的比对注释并统计;
步骤4)微生物菌群代谢潜能分析:使用Python脚本调用Humann2软件对微生物宏基因组数据进行菌群的代谢潜能分析,计算分析功能基因和代谢通路的组成;
步骤5)微生物多样性分析:使用Python编写的多样性计算脚本计算微生物香农多样性指数和辛普森多样性指数;
步骤6)结果统计和输出:使用Python脚本统计上述步骤中的结果文件,包括...

【专利技术属性】
技术研发人员:罗奇斌申玉林廖胜光任毅
申请(专利权)人:天津奇云诺德生物医学有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1