一种分析微生物群落结构所需测序量的预测方法技术

技术编号:14852972 阅读:107 留言:0更新日期:2017-03-18 20:04
本发明专利技术公开了一种分析微生物群落结构所需测序量的预测方法。通过拟合因测序量不足引起的群落间距离与测序量之间的回归关系,获得两者之间的回归方程,并通过预测误差与测序量之间的回归关系对该回归方程进行校正。随着测序量的增加,因测序量不足引起的群落间距离会逐渐变小;当该距离接近0时,多次重复采样获得的群落结构的相似性就接近100%,该群落结构就能够代表环境中的微生物群落组成。因此,通过设定所获得的线性方程中的群落间距离为0,根据校正后的回归方程可以较为准确地预测出能够反映环境微生物群落组成所需要的测序量。

【技术实现步骤摘要】

:本专利技术属于微生物生态学领域,具体涉及一种分析微生物群落结构所需测序量的预测方法,尤其是在生态学研究中预测环境中微生物群落结构解析所需最小测序量的方法。
技术介绍
:目前,各种环境中的微生物群落受到广泛关注。随着分析手段的不断发展,我们对同一个样品中的微生物群落组成分析的深度不断加深,从最初一个微生物群落构建几十个细菌16SrRNA基因克隆进行测序分析到目前通过高通量测序技术分析到几万甚至几十万条16SrRNA基因序列。这极大地拓展了我们对环境中微生物多样性的认识。然而,尽管高通量测序技术能够做到对每个样品中上百万的细菌16SrRNA基因序列进行测序分析,并成为目前微生物群落结构解析的主流手段,但是考虑到测序成本,目前多数分析还处于对每个样品进行上万到十几万条细菌16SrRNA基因序列测序的深度。自然环境中,微生物具有极高的多样性,如1克土壤中预计含有107-1011个细菌细胞,几千甚至上万种细菌。这些微生物在群落中的分布极不均匀,通常少数几种优势种占据微生物群落中总细胞数的80%以上。另外,通常作为分子标记用于解析细菌群落结构的细菌16SrRNA基因在基因组中的拷贝数有1-15个不等。以上因素都增加了通过16SrRNA基因序列的测序解析微生物群落结构的难度。尽管目前普遍认为测序深度越深,对微生物群落结构的解析越充分,但究竟最少需要对多少16SrRNA基因序列进行测序才能够代表性地解析微生物群落中的物种组成目前尚不清楚,这就导致我们难以判断所获得的微生物群落结构是否能够真实反映它们在自然条件下的情况。
技术实现思路
:为了克服目前无法判断获取具有代表意义的微生物群落所需要的最少测序量,本专利技术的目的是提供一种分析微生物群落结构所需测序量的预测方法,该方法能够通过对同一样品进行最少三次较低深度的重复测序来准确预测要获得拟分析的微生物群落组成的有效信息时所需要的测序量。本专利技术的分析微生物群落结构所需测序量的预测方法,其特征在于,包括以下步骤:一、校正函数PSb/AS=a'·log10(PSb)+b'中a'和b'的获得a、选择不少于10个已有16SrRNA基因测序信息且与拟分析的微生物群落结构生境接近的微生物群落,命名为微生物群落M1、M2、M3、……、Mn,n≥10,每个微生物群落含有的16SrRNA序列数为AS;对于上述M1、M2、M3、……、Mn微生物群落,确定不少于5个随机抽样深度进行抽样获得16SrRNA基因序列组,分别命名为D1、D2、D3、……、Dn序列数目的16SrRNA基因序列组,n≥5,这些16SrRNA基因序列组满足以下特点:(1)这n组序列数目的16SrRNA基因序列组的序列数量各不相同但最多的序列数量不超过所选择的微生物群落中AS最少的16SrRNA基因序列数,即D1≠D2≠D3≠……≠Dn,且mix{D1,D2,D3,……,Dn本文档来自技高网
...
一种分析微生物群落结构所需测序量的预测方法

【技术保护点】
一种分析微生物群落结构所需测序量的预测方法,其特征在于,包括以下步骤:一、校正函数PSb/AS=a'·log10(PSb)+b'中a'和b'的获得a、选择不少于10个已有16S rRNA基因测序信息且与拟分析的微生物群落结构生境接近的微生物群落,命名为微生物群落M1、M2、M3、……、Mn,n≥10,每个微生物群落含有的16S rRNA序列数为AS;对于上述M1、M2、M3、……、Mn微生物群落,确定不少于5个随机抽样深度进行抽样获得16S rRNA基因序列组,分别命名为D1、D2、D3、……、Dn序列数目的16S rRNA基因序列组,n≥5,这些16S rRNA基因序列组满足以下特点:(1)这n组序列数目的16S rRNA基因序列组的序列数量各不相同但最多的序列数量不超过所选择的微生物群落中AS最少的16S rRNA基因序列数,即D1≠D2≠D3≠……≠Dn,且mix{D1,D2,D3,……,Dn}≤min{AS};(2)D1、D2、D3、……、Dn序列数目的16S rRNA基因序列组,每个微生物群落每个序列数目的16S rRNA基因序列组具有3个以上的重复样,即D1序列数目的16S rRNA基因序列组具有3个以上的重复样,D2序列数目的16S rRNA基因序列组具有3个以上的重复样,依此类推;(3)分别从M1、M2、M3、……、Mn微生物群落抽取的D1、D2、D3、……、Dn序列数目的16S rRNA基因序列组,它们的D1、D2、D3、……、Dn序列数目是一致的,即所有微生物群落抽取的3个D1序列数目的16S rRNA基因序列组的序列数目是相同的,都是D1;所有微生物群落抽取的3个D2序列数目的16S rRNA基因序列组的序列数目是相同的,都是D2;依此类推;b、在相同的抽样深度条件下,分别计算每个微生物群落中D1、D2、D3、……、Dn序列数目的16S rRNA基因序列组中抽取的3个重复样的群落间距离d,然后对每个微生物群落单独拟合序列数目D1、D2、D3……Dn的10为底的对数函数值与群落间距离d之间的相关方程d=a·log10D+b,上述所述D为序列数目,获得式中的a值和b值;c、令d=0,计算每个微生物群落预测的测序深度PSb,即方程d=a·log10D+b中d=0时的D值;d、比较每个微生物群落预测的测序深度PSb与AS之间的差异,并通过拟合方程PSb/AS=a'·log10(PSb)+b'获得a'和b'的值;二、预测群落所需最少测序量对拟分析的微生物群落中的16S rRNA基因进行若干次重复的随机PCR扩增,并进行测序,得到若干个数据集,分别从每个测序的数据集中抽取a1、a2、a3、……、an序列数的序列,由各个数据集中抽取的a1组成{a1}数据集,a2组成{a2}数据集,以此类推,分别计算相同序列数D的数据集之间的群落间距离d,所述的若干次指3次以上,所述的a1、a2、a3、……、an序列数,满足a1≠a2≠a3≠……≠an,所述的n≥5;根据得到的D和相对应的d拟合方程d=a·log10D+b,并获得式中的a值和b值;根据公式PSa=PSb/(PSb/PSa)≈PSb/(PSb/AS)=(10‑b/a)/(b'‑a'·b/a),代入a'、b'、a和b值,计算获得分析微生物群落结构所需测序量PSa。...

【技术特征摘要】
1.一种分析微生物群落结构所需测序量的预测方法,其特征在于,包括以下步骤:
一、校正函数PSb/AS=a'·log10(PSb)+b'中a'和b'的获得
a、选择不少于10个已有16SrRNA基因测序信息且与拟分析的微生物群落结构生境接
近的微生物群落,命名为微生物群落M1、M2、M3、……、Mn,n≥10,每个微生物群落含有
的16SrRNA序列数为AS;
对于上述M1、M2、M3、……、Mn微生物...

【专利技术属性】
技术研发人员:倪加加许玫英李筱婧
申请(专利权)人:广东省微生物研究所
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1