Describes the factors that affect the fragmentation pattern of free DNA (e.g. plasma DNA) and the application of free DNA fragmentation mode analysis, including applications in molecular diagnostics. Various applications can use the characteristics of fragmentation patterns to determine the proportion contribution of specific tissue types to determine the genotypes of specific tissue types (such as fetal tissues in the maternal sample or tumor tissues from cancer patients), and / or identify the preferred end positions of specific tissue types, which can then be used. To determine the proportion of specific organization types.
【技术实现步骤摘要】
【国外来华专利技术】游离DNA的片段化模式的分析相关申请的交叉引用本申请要求2015年7月23日提交的美国临时申请第62/196,250号和2016年2月12日提交的第62/294,948号以及2016年2月14日提交的PCT申请第PCT/CN2016/073753号的优先权,其全部内容出于所有目的以引用的方式并入本文中。
技术介绍
在先前研究中,已经表明血浆DNA主要由小于200bp的短片段组成(Lo等人《科学·转化医学(SciTranslMed)》2010;2(61):61ra91)。在血浆DNA的尺寸分布中,峰值可以观测于166bp处。另外,观测到当对母体血浆DNA测序时,测序的标签密度将在转录起始位点(TSS)附近以约180bp的周期性变化(Fan等人《美国国家科学院院刊(PNAS)》2008;105:16266-71)。这些结果是血浆DNA的片段化可能不是随机过程的一组证据。但是,血浆中的DNA片段化的精确模式以及管控所述模式的因素尚不明确。另外,尚未完全实现使用DNA片段化的实际应用。
技术实现思路
各种实施例涉及游离DNA,例如血浆DNA和血清DNA的片段化模式的分析的应用(例如诊断应用)。一种应用的实施例可以确定来自不同组织类型的游离DNA的混合物中的特定组织类型的比例贡献的分类。举例来说,特定百分比、百分比范围或比例贡献是否高于指定百分比,可以确定为分类。在一个实例中,可以识别特定组织类型的优选的结束位置,且结束于优选的结束位置上的游离DNA分子的相对丰度可以用于提供比例贡献的分类。在另一实例中,可以使用对特定组织类型具有特异性的区域中的片段化模式的幅度(例如结束于基 ...
【技术保护点】
分析生物样品以确定来自包括第一组织类型的多个组织类型的游离DNA分子的混合物中的所述第一组织类型的比例贡献的分类的方法,所述生物样品包括所述混合物,所述方法包括:识别所述第一组织类型的游离DNA分子的末端以高于阈值的比率出现的基因组位置的第一集合;通过计算机系统分析来自个体的所述生物样品的第一多个游离DNA分子,其中分析游离DNA分子包括:确定对应于所述游离DNA分子的至少一个末端的参考基因组中的基因组位置;基于所述第一多个游离DNA分子的所述分析,确定第一数目的所述第一多个游离DNA分子结束于多个窗口中的一个内,每一窗口包括所述基因组位置的第一集合中的至少一个;通过使用游离DNA分子的第二数目对所述第一多个游离DNA分子的所述第一数目进行标准化来计算结束于所述多个窗口中的一个内的所述第一多个游离DNA分子的相对丰度,其中所述第二数目的游离DNA分子包括结束于基因组位置的第二集合处的游离DNA分子,所述基因组位置的第二集合在包括所述基因组位置的第一集合的所述多个窗口之外;和通过比较所述相对丰度与一个或多个校准值确定所述第一组织类型的所述比例贡献的分类,所述校准值由一个或多个已知所述第一 ...
【技术特征摘要】
【国外来华专利技术】2015.07.23 US 62/196,250;2016.02.12 US 62/294,948;1.分析生物样品以确定来自包括第一组织类型的多个组织类型的游离DNA分子的混合物中的所述第一组织类型的比例贡献的分类的方法,所述生物样品包括所述混合物,所述方法包括:识别所述第一组织类型的游离DNA分子的末端以高于阈值的比率出现的基因组位置的第一集合;通过计算机系统分析来自个体的所述生物样品的第一多个游离DNA分子,其中分析游离DNA分子包括:确定对应于所述游离DNA分子的至少一个末端的参考基因组中的基因组位置;基于所述第一多个游离DNA分子的所述分析,确定第一数目的所述第一多个游离DNA分子结束于多个窗口中的一个内,每一窗口包括所述基因组位置的第一集合中的至少一个;通过使用游离DNA分子的第二数目对所述第一多个游离DNA分子的所述第一数目进行标准化来计算结束于所述多个窗口中的一个内的所述第一多个游离DNA分子的相对丰度,其中所述第二数目的游离DNA分子包括结束于基因组位置的第二集合处的游离DNA分子,所述基因组位置的第二集合在包括所述基因组位置的第一集合的所述多个窗口之外;和通过比较所述相对丰度与一个或多个校准值确定所述第一组织类型的所述比例贡献的分类,所述校准值由一个或多个已知所述第一组织类型的比例贡献的校准样品确定。2.根据权利要求1所述的方法,其中识别所述基因组位置的第一集合包括:通过计算机系统分析来自至少一个第一额外样品的第二多个游离DNA分子以识别所述第二多个游离DNA分子的结束位置,其中已知所述至少一个第一额外样品包括所述第一组织类型且与所述生物样品属于相同样品类型;对于多个基因组窗口中的每个基因组窗口:计算结束于所述基因组窗口上的所述第二多个游离DNA分子的对应数目;且比较所述对应数目与参考值以确定结束于所述基因组窗口内的一个或多个基因组位置上的游离DNA分子的比率是否高于所述阈值。3.根据权利要求2所述的方法,其中所述多个基因组窗口中的第一基因组窗口具有大于一个基因组位置的宽度,且其中当所述对应数目超过所述参考值时,将所述第一基因组窗口内的所述基因组位置中的每一个识别为具有高于所述阈值的结束于所述基因组位置上的游离DNA分子的比率。4.根据权利要求2所述的方法,其中所述基因组位置的第一集合具有所述对应数目的最高N值,其中N为至少10,000。5.根据权利要求2所述的方法,其还包括:确定所述第二多个游离DNA分子中的每一个的尺寸,其中识别所述基因组位置的第一集合还包括:确定所述第二多个游离DNA分子中结束于第一基因组窗口内的游离DNA分子的尺寸分布的第一统计值,所述第一基因组窗口经确定具有高于所述阈值的比率;比较所述第一统计值与尺寸阈值;且当所述第一统计值不超过所述尺寸阈值时,从所述基因组位置的第一集合排除所述第一基因组窗口。6.根据权利要求2所述的方法,其中所述一个或多个校准样品包括所述至少一个第一额外样品。7.根据权利要求6所述的方法,其还包括:对于一个或多个校准样品中的每一个:测量所述第一组织类型的对应比例贡献;且使用结束于与所述基因组位置的第一集合相对应的所述多个窗口内的所述第二多个游离DNA分子的所述对应数目确定对应相对丰度,借此获得校准数据点,其中每个校准数据点指定所述第一组织类型对所述额外生物样品的经测量的比例贡献和所述对应相对丰度。8.根据权利要求7所述的方法,其中所述一个或多个校准数据点是多个校准数据点,所述多个校准数据点形成接近所述多个校准数据点的校准函数。9.根据权利要求2所述的方法,其中所述基因组位置的第一集合的每个基因组位置具有至少指定数目的结束于所述基因组位置上的所述第二多个游离DNA分子中的游离DNA分子。10.根据权利要求2所述的方法,其中所述参考值是根据所述至少一个第一额外样品中的游离DNA分子的概率分布和平均长度,结束于所述基因组窗口内的游离DNA分子的预期数目。11.根据权利要求10所述的方法,其中所述概率分布是泊松分布,且其中确定结束于所述基因组窗口内的一个或多个基因组位置上的游离DNA分子的比率是否高于所述阈值包括:使用所述对应数目和所述预期数目确定对应p值,其中所述阈值对应于截止p值,所述对应p值小于所述截止p值指示结束于所述基因组窗口内的游离DNA分子的比率高于所述阈值。12.根据权利要求2所述的方法,其中结束于所述基因组位置上的所述第二多个游离DNA分子的比率高于所述阈值的所述基因组位置包含第一超集,且其中识别所述基因组位置的第一集合还包括:通过所述计算机系统分析来自至少一个第二额外样品的第三多个游离DNA分子,以识别结束于所述基因组位置上的所述第三多个游离DNA分子中高于所述阈值的第二超集,所述第二额外样品被识别为具有减少量的所述第一组织类型;且将所述基因组位置的第一集合识别为包括在所述第一超集中且不在所述第二超集中的所述基因组位置。13.根据权利要求2所述的方法,其中所述参考值包括结束于所述基因组窗口内的游离DNA分子的测量数目,所述测量数目由识别为不具有所述第一组织类型的至少一个第二额外样品的第三多个游离DNA分子确定。14.根据权利要求13所述的方法,其还包括:确定所述第二多个游离DNA分子中的每一个的尺寸,其中识别所述基因组位置的第一集合还包括:确定所述第二多个游离DNA分子中结束于第一基因组位置上的游离DNA分子的第一尺寸分布的第一统计值,所述第一基因组位置经确定具有高于所述阈值的所述比率;确定所述第三多个游离DNA分子中结束于一个或多个第二基因组位置上的游离DNA分子的第二尺寸分布的第二统计值,所述第二基因组位置经确定具有高于所述阈值的所述比率;比较所述第一统计值与第二统计值;以及当所述第一统计值不超过所述第二统计值至少指定量时,从所述基因组位置的第一集合排除所述第一基因组位置,所述指定量指示所述第一尺寸分布小于所述第二尺寸分布。15.根据权利要求13所述的方法,其中比较所述对应数目与所述参考值包括:计算所述对应数目与覆盖所述基因组窗口的所述第二多个游离DNA分子的第三数目的第一比率;以及比较所述第一比率与所述参考值,所述参考值包括结束于所述基因组窗口内的读取的所述测量数目与覆盖所述基因组窗口且不结束于所述基因组窗口内的所述第三多个游离DNA分子的第四数目的参考比率。16.根据权利要求15所述的方法,其中所述第三数目的所述第二多个游离DNA分子不结束于所述基因组窗口内。17.根据权利要求15所述的方法,其中确定结束于所述基因组窗口内的游离DNA分子的比率是否高于所述阈值包括:确定所述第一比率是否大于相乘因数乘以所述参考比率。18.根据权利要求2所述的方法,其中所述生物样品和所述至少一个第一额外样品的所述样品类型选自:血浆、血清、脑脊髓液和尿液。19.根据权利要求2所述的方法,其中所述基因组窗口为基因组位置,且其中所述第一组织类型具有多个第一组织特异性等位基因,且其中计算结束于所述基因组位置上的所述第二多个游离DNA分子的所述对应数目包括:识别结束于所述基因组位置上的所述游离DNA分子是否包括所述多个第一组织特异性等位基因中的至少一个;当所述游离DNA分子包括第一组织特异性等位基因时,在所述对应数目中包括所述游离DNA分子;且当所述游离DNA分子不包括第一组织特异性等位基因时,在所述对应数目中不包括所述游离DNA分子。20.根据权利要求1所述的方法,其中所述第一组织类型在至少一个额外样品中具有多个第一组织特异性等位基因,且其中所述基因组位置的第一集合使用所述至少一个额外样品中包括所述多个第一组织特异性等位基因中的至少一个的游离DNA分子来确定。21.根据权利要求20所述的方法,其中所述基因组位置的第二集合使得第二组织类型的游离DNA分子的末端以高于所述阈值的比率出现于所述至少一个额外样品中,其中所述第二组织类型在所述至少一个额外样品中具有多个第二组织特异性等位基因,且其中所述基因组位置的第二集合使用所述至少一个额外样品中包括所述多个第二组织特异性等位基因中的至少一个的游离DNA分子确定。22.根据权利要求21所述的方法,其中所述至少一个额外样品来自怀孕女性,且其中所述第一组织类型为胎儿组织且所述第二组织类型为母体组织。23.根据权利要求21所述的方法,其中将具有所述第一组织类型与所述第二组织类型的共用等位基因的游离DNA分子的末端以高于所述阈值的第二比率出现的基因组位置,从所述基因组位置的第一集合排除且从所述基因组位置的第二集合排除。24.根据权利要求1所述的方法,其中所述相对丰度包括所述第一数目与所述第二数目的比率。25.根据权利要求1所述的方法,其中所述多个窗口具有一个基因组位置的宽度,且其中所述相对丰度通过如下计算:对于所述基因组位置的第一集合中的每个基因组位置:计算结束于所述基因组位置上的所述第一多个游离DNA分子的对应数目,作为确定所述第一数目的所述第一多个游离DNA分子结束于所述基因组位置的第一集合中的任一个上的一部分;计算覆盖所述基因组位置且不结束于所述基因组位置上的所述第一多个游离DNA分子的第三数目,作为确定游离DNA分子的所述第二数目的一部分;计算所述对应数目与所述第三数目的第一比率;计算所述第一比率的平均值作为所述相对丰度。26.根据权利要求1所述的方法,其中所述相对丰度通过如下计算:对于所述基因组位置的第一集合中的每个基因组位置:计算结束于包括所述基因组位置的第一窗口内的所述第一多个游离DNA分子的对应数目,作为确定所述第一数目的所述第一多个游离DNA分子结束于所述多个窗口中的一个内的一部分;计算结束于包括所述基因组位置的第二窗口内的所述第一多个游离DNA分子的第三数目,所述第二窗口大于所述第一窗口;计算所述对应数目与所述第三数目的第一比率;计算所述第一比率的平均值作为所述相对丰度。27.根据权利要求1所述的方法,其中所述基因组位置的第二集合与所述基因组位置的第一集合不重叠。28.根据权利要求1所述的方法,其中所述基因组位置的第二集合包括对应于所述第一多个游离DNA分子中的至少一个的末端的所有基因组位置。29.根据权利要求1所述的方法,其中分析所述游离DNA分子中的一个或多个包括确定对应于所述游离DNA分子的两个末端的两个基因组位置。30.根据权利要求1所述的方法,其中所述比例贡献的分类对应于高于指定百分比的范围。31.根据权利要求1所述的方法,其中所述第一组织类型为肿瘤。32.根据权利要求31所...
【专利技术属性】
技术研发人员:卢煜明,赵慧君,陈君赐,江培勇,
申请(专利权)人:香港中文大学,
类型:发明
国别省市:中国香港,81
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。