一种基于隐藏亚组的绝对定量分析方法及系统技术方案

技术编号:36731542 阅读:11 留言:0更新日期:2023-03-04 09:58
本申请涉及一种测序数据绝对定量的生信分析方法和系统。本方法基于阴性对照与阳性对照之间形成的隐藏亚组,以及待测样本与阴性对照之间形成的隐藏亚组,对待测样本进行绝对定量。本申请不依赖于任何对待测真实信号的先验知识,即可准确定量待测样本。即可准确定量待测样本。即可准确定量待测样本。

【技术实现步骤摘要】
一种基于隐藏亚组的绝对定量分析方法及系统


[0001]本申请涉及生信分析领域,具体涉及一种基于隐藏亚组的绝对定量分析方法及系统。
技术背景
[0002]除微生物群落组成结构之外,组分的绝对定量测定非常重要,现有方法常常通过在待测样本中添加已知数量的内部参考品,并根据内部参考品在最终群落中的相对比例,逆向推测群落其他微生物的绝对含量。由于现有技术条件的限制,添加的内部参考品的量往往较高,(高于0.01ng),使得这一思路对于低生物量的样本十分不友好,因为添加内部参考品会不可避免地挤压样本中真实微生物核酸被测序的概率,从而造成不准确的定量结果。
[0003]本专利技术基于上文提到的微生物群落组成的组分之间的连接,可以找到来自阴性对照中的隐藏分组,并通过该隐藏分组在阴性对照中的比例反向推导实验样本与阴性对照之间的比例关系。为了达到绝对定量,本研究在宏基因组测序的过程中同时引入阴性对照和已知数量的阳性对照,通过计算来自阴性对照的隐藏分组在阳性对照和阴性对照中的比例关系,可以推断出阴性对照相对于阳性对照的比例,由于阳性对照的量已知,故而得到阴性对照的绝对定量。再通过计算来自阴性对照的隐藏分组在阴性对照和真实样本中的比例关系,可以推断出真实样本相对于阴性对照的比例,由于阴性对照的量已知,故而得到真实样本的绝对定量。鉴于此,提出本申请。

技术实现思路

[0004]本申请要解决的核心问题是如何利用当前实验所能提供的信息,针对性地对当前测序实验数据进行准确的定量分析。
[0005]因此,本申请的第一目的是提供一种测序数据绝对定量的生信分析方法、系统或计算机程序;
[0006]本申请的第二目的是提供隐藏亚组在测序数据绝对定量生信分析中的应用。
[0007]基于上述目的,本申请提供如下技术方案:
[0008]本申请还提供一种测序数据绝对定量的生信分析方法,包括如下步骤:
[0009]步骤1)测序读出序列分组为不同分类单元;
[0010]步骤2)分类单元统计步骤;
[0011]步骤3)分类单元相互关系计算步骤;
[0012]步骤4)鉴定隐藏亚组步骤;
[0013]步骤5)通过隐藏亚组对阴性对照进行绝对定量步骤;
[0014]步骤6)通过隐藏亚组对待测样本进行绝对定量步骤。
[0015]进一步的,所述隐藏亚组为两个或多个条件下信号共同出现的形式,由两个或两个以上的元素组成;
[0016]优选的,所述隐藏亚组来自实验过程中或生信分析过程中相同来源引入的信号,所述隐藏亚组内部元素俩俩之间的比例在两个或多个条件下保持稳定;
[0017]更优选的,所述步骤5)的隐藏亚组来自阴性对照与阳性对照之间形成的隐藏亚组;所述步骤6)的隐藏亚组待测样本与阴性对照之间形成的隐藏亚组。
[0018]进一步的,所述步骤1)分组方式包括但不限于基于比对的分组方法或不基于比对的分组方法。
[0019]进一步的,所述基于比对的分组方法采用比对软件对测序读出序列进行序列比对,所有比对到同一分类单元的测序读出序列归纳为一组;
[0020]进一步的,所述不基于比对进行分组的方法包括但不限于kmer方法、哈希表方法或字符串匹配方法。
[0021]进一步的,所述步骤2)的统计为基于步骤1)分类单元的分组结果,计算每一个分类单元的统计量;
[0022]进一步的,所述统计量包括但不限于:统计每一个分类单元的支持测序读出序列数目、统计每一个分类单元的相对比例、统计每一个分类单元经过某种归一化之后的统计量。
[0023]进一步的,所述步骤3)为针对步骤2)的分类单元统计量将每两个分类单元进行配对,并计算配对中的两个分类单元比例是否在两种或多种条件下维持稳定;在一些实施方式中,所述维持稳定表明该配对的分类单元相互之间具有联系。
[0024]进一步的,所述步骤3)中多个条件下包括:在待测样本条件下、在阴性对照条件下、在阳性对照条件下。
[0025]在一些实施方式中,所述步骤3)中,所述配对可以为随机配对;所述两个分类单元比例可以通过分类单元统计量的相除得到,或通过分类单元统计量的统计检验得到。
[0026]进一步的,所述步骤4)为针对步骤2)的分类单元和步骤3)的分类单元相互关系,进行隐藏亚组的鉴定和分析。
[0027]进一步的,所述步骤4)鉴定隐藏亚组是通过无先验信息的方式进行隐藏亚组分析;
[0028]进一步的,所述鉴定和/或分析是利用用于分析俩个或多个元素之间关联或元素本身特点的数学分析方法进行;
[0029]在一些实施方式中,所述鉴定和分析是利用计算机学科的图论(graph)方法进行,即,将步骤2)中的每一个分类单元作为图的顶点(node),每一个步骤3)中的具有联系的配对做为图的边(edge),构成一个完整的无向图;在无向图中,使用经典的图分析方法,找到其中的完全子图(complete subgraph),该完全子图即作为隐藏亚组;优选的,所述完全子图的顶点数在2及2以上。
[0030]进一步的,所述步骤5)为针对步骤4)中得到的在阴性对照和阳性对照中稳定存在的隐藏亚组,并选取在阴性对照中占比较高(优选最高)的亚组作为假设内参(pseudo

internal control,PIC)。使用PIC在阴性对照中的比例和其在阳性对照中的比例进行比较,即可得到阴性对照相对于阳性对照整体的比例,由于阳性对照的绝对数量已知,从而可以计算得到阴性对照的绝对数量。
[0031]进一步的,所述步骤6)为针对步骤4)中得到的在阴性对照和待测样本中稳定存在
的隐藏亚组,并选取在阴性对照中占比占比较高(优选最高)的亚组作为假设内参(pseudo

internal control,PIC)。使用PIC在阴性对照中的比例和其在待测样本中的比例进行比较,即可得到阴性对照相对于待测样本整体的比例,由于阴性对照的绝对数量已从步骤5)中计算得知,从而可以计算得到待测样本的绝对数量。
[0032]本申请还提供一种测序数据绝对定量的生信分析系统,包括如下模块:
[0033]步骤1)测序读出序列分组为不同分类单元模块;
[0034]步骤2)分类单元统计模块;
[0035]步骤3)分类单元相互关系计算模块;
[0036]步骤4)鉴定隐藏亚组模块;
[0037]步骤5)通过隐藏亚组对阴性对照进行绝对定量模块;
[0038]步骤6)通过隐藏亚组对待测样本进行绝对定量模块。
[0039]其中,上述模块1)

6)分别执行上述测序数据绝对定量的生信分析方法中的步骤1)

6)。
[0040]进一步的,所述隐藏亚组为两个或多个条件下信号共同出现的形式,由两个或两个以上的元素组成;
[0041]优选的,所述隐藏亚组来自实验过程中或生信分析过程中相同来源引入的信号,所述隐藏亚组内部本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种测序数据绝对定量的生信分析方法,其特征在于,所述方法包括如下步骤:步骤1)测序读出序列分组为不同分类单元;步骤2)分类单元统计步骤;步骤3)分类单元相互关系计算步骤;步骤4)鉴定隐藏亚组步骤;步骤5)通过隐藏亚组对阴性对照进行绝对定量步骤;步骤6)通过隐藏亚组对待测样本进行绝对定量步骤。2.权利要求1所述的生信分析方法,其特征在于,所述隐藏亚组为两个或多个条件下信号共同出现的形式,由两个或两个以上的元素组成;优选的,所述隐藏亚组来自实验过程中或生信分析过程中相同来源引入的信号,所述隐藏亚组内部元素俩俩之间的比例在两个或多个条件下保持稳定;更优选的,所述步骤5)的隐藏亚组来自阴性对照与阳性对照之间形成的隐藏亚组;所述步骤6)的隐藏亚组待测样本与阴性对照之间形成的隐藏亚组。3.权利要求1

2任一所述的生信分析方法,其特征在于,所述步骤1)分组方式包括但不限于基于比对的分组方法或不基于比对的分组方法;所述基于比对的分组方法采用比对软件对测序读出序列进行序列比对,所有比对到同一分类单元的测序读出序列归纳为一组;所述不基于比对进行分组的方法包括但不限于kmer方法、哈希表方法或字符串匹配方法。4.权利要求1

3任一所述的生信分析方法,其特征在于,所述步骤2)的统计为基于步骤1)分类单元的分组结果,计算每一个分类单元的统计量;优选的,所述统计量包括但不限于:统计每一个分类单元的支持测序读出序列数目、统计每一个分类单元的相对比例、统计每一个分类单元经过某种归一化之后的统计量。5.权利要求1

4任一所述的生信分析方法,其特征在于,所述步骤3)为针对步骤2)的分类单元统计量将每两个分类单元进行配对,并计算配对中的两个分类单元比例是否在两种或多种条件下维持稳定;所述维持稳定表明该配对的分类单元相互之间具有联系。优选的,所述条件包括:在待测样本条件下、在阴性对照条件下、和在阳性对照条件下。6.权利要求1

5任一所述的生信分析方法,其特征在于,所述步骤3)中,所述配对可以为随机配对;所述两个分类单元比例可以通过分类单元统计量的相除得到,或通过分类单元统计量的统计检验得到。7.权利要求1

6任一所述的生信分析方法,其特征在于,所述步骤4)为针对步骤2)的分类单元和步骤3)的分类单元相互关系,进行隐藏亚组的鉴定和分析;所述隐藏亚组为两个或多个条件下信号共同出现的形式,由两个或两个以上的元素组成;隐藏亚组内部元素俩俩之间的比例在两个或多个条件下保持稳定;优选的,所述隐藏亚组来自阴性对照与阳性对照之间形成的隐藏亚组,和待测样本与阴性对照之间形成的隐藏亚组。8.权利要求7所述的生信分析方法,其特征在于,所述步骤4)鉴定隐藏亚组是通过无先验信息的方式进行隐藏亚组的鉴定和/或分析;优选的,所述鉴定和/或分析是利用用于分析俩个或多个元素之间关联或元素本身特
点的数学分析方法进行;更优选的,所述鉴定和分析是利用计算机学科的图论(graph)方法进行,即,将步骤2)中的每一个分类单元作为图的顶点(node),每一个步骤3)中的具有联系的配对做为图的边(edge),构建设完整的无向图;在无向图中,找到其中...

【专利技术属性】
技术研发人员:夏涵胡龙官远林梁晓雪魏康飞段美林
申请(专利权)人:西咸新区予果微码生物科技有限公司予果智造科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1