一种16S测序和ITS测序数据关联分析方法及系统技术方案

技术编号:27591686 阅读:59 留言:0更新日期:2021-03-10 10:09
本发明专利技术是关于一种16S测序和ITS测序数据关联分析方法及系统。该方案包括对细菌样本进行16S测序和对真菌样本进行ITS测序,获取16S测序数据和ITS测序数据。根据所述16S测序数据和所述ITS测序数据进行alpha多样性分析,beta多样性分析,物种分析,环境因子关联分析,并可视化展示分析结果。该方案提供16S与ITS测序数据关联分析方法,分析方法提供了系统、全面的分析思路,可对比细菌、真菌对环境变化等分组差异的响应规律,在研究细菌与真菌的物种关系网络,揭示物种间的关联互作机制发挥重要作用。用。用。

【技术实现步骤摘要】
一种16S测序和ITS测序数据关联分析方法及系统


[0001]本专利技术涉及数据处理和分析领域,尤其涉及一种16S测序和ITS测序数据关联分析方法及系统。

技术介绍

[0002]自然界中,细菌与真菌广泛共存,共同构成微生物群落的主体。随着微生物群落研究的普及,对群落内部细菌和真菌的同步细致探究,也越来越重要。由于生态位差异,细菌和真菌对环境刺激等的响应不同,为了开展全面系统的微生物研究,需要同时分析细菌和真菌。
[0003]又由于可能存在底物竞争、分泌抗生素等,细菌与真菌之间也存在一定的相互作用。有研究表明,16S、ITS、18S两两之间,16S与ITS的相关程度最高,暗示真菌与细菌间存在较强的关联。因此,对各样本同时开展16S与ITS测序的两组学分析,可以进一步扩大微生物群落的研究范围、拓展微生物驱动和响应机制的研究深度。
[0004]目前主要是对16S测序数据和ITS测序数据的单独分析,尚未有方法可以将两组学的测序数据进行全面、系统的关联分析,因此专利技术人经研究开发提供本专利技术方法,克服现有技术中的问题。

技术实现思路

[0005]为克服相关技术中存在的问题,本专利技术提供一种16S测序和ITS测序数据关联分析方法及系统,从而解决单一组学数据无法全面分析的缺陷,也将两组学数据结合实现挖掘数据关联关系的互作机制。
[0006]根据本专利技术,提供一种16S测序和ITS测序数据关联分析方法。该方法包括:对细菌样本进行16S测序,获取16S测序数据,所述16S测序数据为16S OTU丰度表和16S物种丰度表;对真菌样本进行ITS测序,获得ITS测序数据包括ITS OTU丰度表和ITS物种丰度表;所述物种丰度表,为各分类水平物种丰度表,具体包括门水平丰度表,纲水平丰度表,目水平丰度表,科水平丰度表,属水平丰度表,种水平丰度表;根据所述16S测序数据和所述ITS测序数据进行alpha多样性分析,具体包括:alpha多样性指数比值差异分析和alpha多样性person相关性分析,并可视化展示分析结果;根据所述16S测序数据和所述ITS测序数据进行beta多样性分析,具体包括:beta多样性统计检验、Mantel test分析和Procrustes test分析,并可视化展示分析结果;根据所述16S测序数据和所述ITS测序数据进行物种分析,具体包括:物种分布分析、sPLS分析和SparCC分析,并可视化展示分析结果;根据所述16S测序数据和所述ITS测序数据进行环境因子关联分析,并可视化展示分析结果。
[0007]优选的,所述alpha多样性指数比值差异分析具体分析方法为:根据所述16S测序数据和所述ITS测序数据,计算16S与ITS alpha多样性各类型指数的比值,再针对alpha多
样性各类型指数比值,使用R语言Vegan包进行比值的统计检验,计算各类型指数比值在分组间的差异程度,并将数据结果通过盒型图可视化展示;所述统计检验具体为,当比较组分组数等于2时使用welch

s t检验,当比较组分组数大于2时使用Tukey HSD检验。
[0008]所述alpha多样性person相关性分析具体分析方法为:根据所述16S测序数据和所述ITS测序数据,使用R语言psych包进行alpha多样性各类型指数的pearson相关性分析,并基于每个样本的alpha多样性各类型指数,绘制相关性散点图可视化展示结果;所述alpha多样性各类型指数,具体包括:sobs指数、shannon指数、chao指数、ace指数、simpson指数、Pielou指数、PD-whole tree指数、goods_coverage指数。
[0009]优选的,所述beta多样性统计检验,具体分析方法为:根据所述16S测序数据和所述ITS测序数据,基于各分类水平的Bray-Curtis距离,统计每个比较组的组内、组间样本距离均值,再使用R语言Vegan包进行组内组间距离差异的Welch

s T检验和Wilcoxon秩和检验分析,以盒型图可视化展示分析结果;其中,所述各分类水平包括OTU水平,门水平,纲水平,目水平,科水平,属水平,种水平。
[0010]优选的,所述Mantel test分析,具体分析方法为:根据所述16S测序数据和所述ITS测序数据,使用R语言vegan包,计算样本间的Bray-curtis距离矩阵,然后检验各物种分类水平下16S和ITS两组学之间的mantel test相关性,最后基于permutation置换检验999次,计算相关显著性,以散点图可视化展示分析结果;所述Procrustes test分析,具体分析方法为:根据所述16S测序数据和所述ITS测序数据,基于各分类水平两组学样本Bray-curtis距离的PCoA结果,使用R语言Vegan包,开展Procrustes test分析,并使用permutation置换检验 999次,进行相关显著性检验,以叠加后的样本分布图可视化展示分析结果;其中,所述各分类水平包括OTU水平,门水平,纲水平,目水平,科水平,属水平,种水平。
[0011]优选的,所述物种分布分析,具体分析方法为:挑选所述16S测序数据中各分类水平排名前10的物种,并存储为第一16S物种;挑选所述ITS测序数据中各分类水平排名前10的物种,并存储为第一ITS物种;对各分类水平所述第一16S物种与所述第一ITS物种取并集,并保存;从各分类水平所述ITS测序数据和所述16S测序数据中除去所述第一16S物种与所述第一ITS物种的并集,并将已知的物种划标注为other,将未知物种标注为unclassified;使用R语言ggplot2包以堆叠图可视化展示两组学所有样本中物种丰度变化;其中,所述两组学为所述16S测序组学和所述ITS测序组学;其中,所述各分类水平包括门水平,纲水平,目水平,科水平,属水平,种水平。
[0012]所述sPLS分析,具体分析方法为:根据所述16S测序数据和所述ITS测序数据,基于OTU、科、属3个分类水平的丰度表,开展两组学sPLS分析,再以样本分布散点图、关联物种散点图、关联物种circos图将分析结果可视化展示。
[0013]所述SparCC分析,具体分析方法为:使用R语言SpiecEasi包计算细菌和真菌的SparCC相关系数和相关显著性分析,再以相关性热图、相关性网络图、网络分析图形将分析结果可视化展示。
[0014]优选的,所述16S测序数据和所述ITS测序数据进行环境因子关联分析,具体分析方法为:
使用R语言psych包计算环境因子间的pearson相关系数;使用R语言vegan包进行alpha多样性、物种矩阵与每个环境因子的mantel test分析;通过permutation置换检验999次,计算相关显著性;利用R语言ggcor包生成热图和网络图结合的形式可视化展示分析结果。
[0015]进一步的,提供一种16S测序和ITS测序数据关联分析系统,该系统包括:组学数据获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种16S测序和ITS测序数据关联分析方法,其特征在于,包括:对细菌样本进行16S测序,获取16S测序数据,所述16S测序数据为16S OTU丰度表和16S物种丰度表;对真菌样本进行ITS测序,获得ITS测序数据包括ITS OTU丰度表和ITS物种丰度表;所述物种丰度表,为各分类水平物种丰度表,具体包括门水平丰度表,纲水平丰度表,目水平丰度表,科水平丰度表,属水平丰度表,种水平丰度表;根据所述16S测序数据和所述ITS测序数据进行alpha多样性分析,具体包括:alpha多样性指数比值差异分析和alpha多样性person相关性分析,并可视化展示分析结果;根据所述16S测序数据和所述ITS测序数据进行beta多样性分析,具体包括:beta多样性统计检验、Mantel test分析和Procrustes test分析,并可视化展示分析结果;根据所述16S测序数据和所述ITS测序数据进行物种分析,具体包括:物种分布分析、sPLS分析和SparCC分析,并可视化展示分析结果;根据所述16S测序数据和所述ITS测序数据进行环境因子关联分析,并可视化展示分析结果。2.根据权利要求1所述的一种16S测序和ITS测序数据关联分析方法,其特征在于:所述alpha多样性指数比值差异分析具体分析方法为:根据所述16S测序数据和所述ITS测序数据,计算16S与ITS alpha多样性各类型指数的比值,再针对alpha多样性各类型指数比值,使用R语言Vegan包进行比值的统计检验,计算各类型指数比值在分组间的差异程度,并将数据结果通过盒型图可视化展示;所述统计检验具体为,当比较组分组数等于2时使用welch

s t检验,当比较组分组数大于2时使用Tukey HSD检验;所述alpha多样性person相关性分析具体分析方法为:根据所述16S测序数据和所述ITS测序数据,使用R语言psych包进行alpha多样性各类型指数的pearson相关性分析,并基于每个样本的alpha多样性各类型指数,绘制相关性散点图可视化展示结果;所述alpha多样性各类型指数,具体包括:sobs指数、shannon指数、chao指数、ace指数、simpson指数、Pielou指数、PD-whole tree指数、goods_coverage指数。3.根据权利要求1所述的一种16S测序和ITS测序数据关联分析方法,其特征在于,所述beta多样性统计检验,具体分析方法为:根据所述16S测序数据和所述ITS测序数据,基于各分类水平的Bray-Curtis距离,统计每个比较组的组内、组间样本距离均值,再使用R语言Vegan包进行组内组间距离差异的Welch

s T检验和Wilcoxon秩和检验分析,以盒型图可视化展示分析结果;所述各分类水平包括OTU水平,门水平,纲水平,目水平,科水平,属水平,种水平。4.根据权利要求1所述的一种16S测序和ITS测序数据关联分析方法,其特征在于:所述Mantel test分析,具体分析方法为:根据所述16S测序数据和所述ITS测序数据,使用R语言vegan包,计算样本间的Bray-curtis距离矩阵,然后检验各物种分类水平下16S和ITS两组学之间的mantel test相关性,最后基于permutation置换检验999次,计算相关显著性,以散点图可视化展示分析结果;所述Procrustes test分析,具体分析方法为:根据所述16S测序数据和所述ITS测序数据,基于各分类水平两组学样本Bray-curtis距离的PCoA结果,使用R语言Vegan包,开展Procrustes test分析,并使用permutation置换检验 999次,进行相关显著性检验,以...

【专利技术属性】
技术研发人员:高川周煌凯陈飞钦艾鹏张秋雪
申请(专利权)人:广州基迪奥生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1