游离DNA的片段化模式的分析制造技术

技术编号:17954716 阅读:45 留言:0更新日期:2018-05-16 03:26
描述影响游离DNA(例如血浆DNA)的片段化模式的因素和游离DNA片段化模式分析的应用,包括在分子诊断学中的应用。各种应用可以使用片段化模式的特性来确定特定组织类型的比例贡献,以确定特定组织类型(例如母体样品中的胎儿组织或来自癌症患者的样品中的肿瘤组织)的基因型,和/或识别特定组织类型的优选的结束位置,其然后可以用于确定特定组织类型的比例贡献。

Analysis of the fragmentation pattern of free DNA

Describes the factors that affect the fragmentation pattern of free DNA (e.g. plasma DNA) and the application of free DNA fragmentation mode analysis, including applications in molecular diagnostics. Various applications can use the characteristics of fragmentation patterns to determine the proportion contribution of specific tissue types to determine the genotypes of specific tissue types (such as fetal tissues in the maternal sample or tumor tissues from cancer patients), and / or identify the preferred end positions of specific tissue types, which can then be used. To determine the proportion of specific organization types.

【技术实现步骤摘要】
【国外来华专利技术】游离DNA的片段化模式的分析相关申请的交叉引用本申请要求2015年7月23日提交的美国临时申请第62/196,250号和2016年2月12日提交的第62/294,948号以及2016年2月14日提交的PCT申请第PCT/CN2016/073753号的优先权,其全部内容出于所有目的以引用的方式并入本文中。
技术介绍
在先前研究中,已经表明血浆DNA主要由小于200bp的短片段组成(Lo等人《科学·转化医学(SciTranslMed)》2010;2(61):61ra91)。在血浆DNA的尺寸分布中,峰值可以观测于166bp处。另外,观测到当对母体血浆DNA测序时,测序的标签密度将在转录起始位点(TSS)附近以约180bp的周期性变化(Fan等人《美国国家科学院院刊(PNAS)》2008;105:16266-71)。这些结果是血浆DNA的片段化可能不是随机过程的一组证据。但是,血浆中的DNA片段化的精确模式以及管控所述模式的因素尚不明确。另外,尚未完全实现使用DNA片段化的实际应用。
技术实现思路
各种实施例涉及游离DNA,例如血浆DNA和血清DNA的片段化模式的分析的应用(例如诊断应用)。一种应用的实施例可以确定来自不同组织类型的游离DNA的混合物中的特定组织类型的比例贡献的分类。举例来说,特定百分比、百分比范围或比例贡献是否高于指定百分比,可以确定为分类。在一个实例中,可以识别特定组织类型的优选的结束位置,且结束于优选的结束位置上的游离DNA分子的相对丰度可以用于提供比例贡献的分类。在另一实例中,可以使用对特定组织类型具有特异性的区域中的片段化模式的幅度(例如结束于基因组位置处的游离DNA分子的数目)。另一应用的实施例可以确定来自不同组织类型的游离DNA的混合物中的特定组织类型的基因型。在一个实例中,可以识别特定组织类型的优选的结束位置,且可以使用结束于优选的结束位置上的游离DNA分子确定基因型。另一应用的实施例可以通过比较游离DNA分子的左末端的局部最大值与游离DNA分子的右末端的局部最大值来识别优选的结束位置。可以在对应局部最大值充分分离时识别优选的结束位置。另外,结束于左末端/右末端的局部最大值上的游离DNA分子的量可以与低分离的局部最大值的游离DNA分子的量进行比较以确定组织类型的比例贡献。其它实施例涉及与本文所述的方法相关的系统、便携式消费装置和计算机可读介质。可以参考以下具体实施方式和附图来更好地了解本专利技术实施例的性质和优点。附图说明图1显示根据本专利技术的实施例的完整概率(PI)的定义的说明性实例。图2A和2B显示根据本专利技术的实施例,使用25作为z值的跨越染色体6上的片段的PI的变化。图3显示母体血浆中的母源性和胎儿源性DNA的PI的同步变化的图示。图4显示母体血浆中的母源性和胎儿源性DNA的PI的异步变化的图示。图5为显示母体和胎儿DNA分子的PI变化是否同步的分析的流程图。图6显示关于母体血浆中的母源性(红色/灰色)和胎儿源性(蓝色/黑色)DNA片段的PI的变化的两个母体血浆样品(S24和S26)的分析。图7显示PI的变化幅度的图示。图8A显示是脱氧核糖核酸酶超敏性位点但不是TSS的区域处的PI变化的模式。图8B显示是TSS但不是脱氧核糖核酸酶超敏性位点的区域处的PI变化的模式。图9显示从不同组织释放的DNA的比例的测量原理的图示。图10显示FRA与混合物中的组织A相对于DNA的比例贡献之间的关系,所述比例贡献通过分析具有已知比例浓度的来自组织A的DNA的两种或更多种校准样品而确定。图11显示FR胎盘与母体血浆中的胎儿DNA百分比之间的相关性。图12显示FR血液与母体血浆中的胎儿DNA浓度之间的相关性。图13为分析生物样品以确定根据本专利技术的实施例的第一组织类型的比例贡献的分类的方法1300的流程图。图14显示肿瘤或胎儿源性DNA的循环DNA片段的差异原理的图示。图15为分析包括来自多个组织类型(包括第一组织类型)的游离DNA分子的混合物的生物样品的方法的流程图。图16为显示对HCC案例具有特异性、对孕妇具有特异性和由两种案例共用的频繁结束位点的数目的文氏图。图17显示校准曲线,其显示结束于癌症特异性结束位置上的经测序DNA片段的比例与具有已知的血浆中的肿瘤DNA分数的癌症患者的血浆中的肿瘤DNA分数之间的关系。图18显示携有胎儿特异性等位基因和由母体和胎儿共用的等位基因的血浆DNA的非随机片段化模式的说明性实例。图19显示基因组坐标作为跨越具有信息性单核苷酸多态性(SNP)的区域的母体血浆DNA片段的结束位置的概率曲线。图20显示跨越在母体中为纯合且在胎儿中为杂合的SNP的血浆DNA片段的结束位置的分析。图21显示跨越在胎儿中为纯合且在母体中为杂合的SNP的血浆DNA片段的结束位置的分析。图22显示具有反复性胎儿(集合A)和母体(集合X)末端的血浆DNA分子的相对丰度(比率(F/M))与胎儿DNA分数之间的相关性。图23A-23E显示关于结束于胎儿优选的结束位置上的片段和结束于母体优选的结束位置上的片段的血浆DNA尺寸分布的数据。图24A-24E显示关于结束于胎儿优选的结束位置上的片段和结束于母体优选的结束位置上的片段的来自26个早期妊娠孕妇的合并的血浆DNA样品中的血浆DNA尺寸分布的数据。图25显示HCC患者的血浆DNA的非随机片段化模式的说明性实例。图26是基因组坐标作为跨越具有突变位点的区域的血浆DNA片段的结束位置的概率曲线。图27A显示跨越突变存在于肿瘤组织中的基因组位置的血浆DNA片段的结束位置的分析。图27B显示71个HCC患者的比率M/WT与血浆中的肿瘤DNA分数之间的相关性。图28A显示孕妇和HCC患者的血浆DNA的优选的结束位置的数目。集合P含有2千9百万个在孕妇中为优选的结束位置。图28B显示在71个HCC患者的比率HCC/Preg与血浆中的肿瘤DNA分数之间观测到正相关。图29A显示优选的末端终止比(PETR)的概念的图示。每条线表示一个血浆DNA片段。图29B显示11个HCC患者的血浆中的肿瘤DNA分数与集合H位置处的PETR之间的相关性。图30显示在结束于HCC优选的末端、HBV优选的末端或共用末端的血浆DNA分子中检测到的短DNA(<150bp)的比例。图31A显示w-PETR的原理的说明。w-PETR的值计算为结束于窗口A与窗口B内的DNA片段的数目之间的比率。图31B显示11个HCC患者中的肿瘤DNA分数与w-PETR的值之间的相关性。图32显示当相比于脐带血血浆样品(210×单倍体基因组覆盖度)时,所研究样品中的每一个的血浆样品中检测的通常共用的优选的结束位置的比例。图33显示文氏图,所述文氏图显示通常观测于两个或更多个样品中的优选的结束位置以及仅观测于任何一个样品中的优选的结束位置的数目。图34A显示血浆中的胎儿DNA分数与通过“产前”与“产后”血浆DNA样品之间的比较识别的位置集合上的平均PETR之间的相关性。图34B显示血浆中的胎儿DNA分数与通过“产前”与“产后”血浆DNA样品之间的比较识别的位置集合上的平均PETR之间的相关性。图35A显示在18周(怀孕个体1)和38周怀孕期(怀孕个体2)的两个孕妇中的顶部1百万个最频繁观测本文档来自技高网...
游离DNA的片段化模式的分析

【技术保护点】
分析生物样品以确定来自包括第一组织类型的多个组织类型的游离DNA分子的混合物中的所述第一组织类型的比例贡献的分类的方法,所述生物样品包括所述混合物,所述方法包括:识别所述第一组织类型的游离DNA分子的末端以高于阈值的比率出现的基因组位置的第一集合;通过计算机系统分析来自个体的所述生物样品的第一多个游离DNA分子,其中分析游离DNA分子包括:确定对应于所述游离DNA分子的至少一个末端的参考基因组中的基因组位置;基于所述第一多个游离DNA分子的所述分析,确定第一数目的所述第一多个游离DNA分子结束于多个窗口中的一个内,每一窗口包括所述基因组位置的第一集合中的至少一个;通过使用游离DNA分子的第二数目对所述第一多个游离DNA分子的所述第一数目进行标准化来计算结束于所述多个窗口中的一个内的所述第一多个游离DNA分子的相对丰度,其中所述第二数目的游离DNA分子包括结束于基因组位置的第二集合处的游离DNA分子,所述基因组位置的第二集合在包括所述基因组位置的第一集合的所述多个窗口之外;和通过比较所述相对丰度与一个或多个校准值确定所述第一组织类型的所述比例贡献的分类,所述校准值由一个或多个已知所述第一组织类型的比例贡献的校准样品确定。...

【技术特征摘要】
【国外来华专利技术】2015.07.23 US 62/196,250;2016.02.12 US 62/294,948;1.分析生物样品以确定来自包括第一组织类型的多个组织类型的游离DNA分子的混合物中的所述第一组织类型的比例贡献的分类的方法,所述生物样品包括所述混合物,所述方法包括:识别所述第一组织类型的游离DNA分子的末端以高于阈值的比率出现的基因组位置的第一集合;通过计算机系统分析来自个体的所述生物样品的第一多个游离DNA分子,其中分析游离DNA分子包括:确定对应于所述游离DNA分子的至少一个末端的参考基因组中的基因组位置;基于所述第一多个游离DNA分子的所述分析,确定第一数目的所述第一多个游离DNA分子结束于多个窗口中的一个内,每一窗口包括所述基因组位置的第一集合中的至少一个;通过使用游离DNA分子的第二数目对所述第一多个游离DNA分子的所述第一数目进行标准化来计算结束于所述多个窗口中的一个内的所述第一多个游离DNA分子的相对丰度,其中所述第二数目的游离DNA分子包括结束于基因组位置的第二集合处的游离DNA分子,所述基因组位置的第二集合在包括所述基因组位置的第一集合的所述多个窗口之外;和通过比较所述相对丰度与一个或多个校准值确定所述第一组织类型的所述比例贡献的分类,所述校准值由一个或多个已知所述第一组织类型的比例贡献的校准样品确定。2.根据权利要求1所述的方法,其中识别所述基因组位置的第一集合包括:通过计算机系统分析来自至少一个第一额外样品的第二多个游离DNA分子以识别所述第二多个游离DNA分子的结束位置,其中已知所述至少一个第一额外样品包括所述第一组织类型且与所述生物样品属于相同样品类型;对于多个基因组窗口中的每个基因组窗口:计算结束于所述基因组窗口上的所述第二多个游离DNA分子的对应数目;且比较所述对应数目与参考值以确定结束于所述基因组窗口内的一个或多个基因组位置上的游离DNA分子的比率是否高于所述阈值。3.根据权利要求2所述的方法,其中所述多个基因组窗口中的第一基因组窗口具有大于一个基因组位置的宽度,且其中当所述对应数目超过所述参考值时,将所述第一基因组窗口内的所述基因组位置中的每一个识别为具有高于所述阈值的结束于所述基因组位置上的游离DNA分子的比率。4.根据权利要求2所述的方法,其中所述基因组位置的第一集合具有所述对应数目的最高N值,其中N为至少10,000。5.根据权利要求2所述的方法,其还包括:确定所述第二多个游离DNA分子中的每一个的尺寸,其中识别所述基因组位置的第一集合还包括:确定所述第二多个游离DNA分子中结束于第一基因组窗口内的游离DNA分子的尺寸分布的第一统计值,所述第一基因组窗口经确定具有高于所述阈值的比率;比较所述第一统计值与尺寸阈值;且当所述第一统计值不超过所述尺寸阈值时,从所述基因组位置的第一集合排除所述第一基因组窗口。6.根据权利要求2所述的方法,其中所述一个或多个校准样品包括所述至少一个第一额外样品。7.根据权利要求6所述的方法,其还包括:对于一个或多个校准样品中的每一个:测量所述第一组织类型的对应比例贡献;且使用结束于与所述基因组位置的第一集合相对应的所述多个窗口内的所述第二多个游离DNA分子的所述对应数目确定对应相对丰度,借此获得校准数据点,其中每个校准数据点指定所述第一组织类型对所述额外生物样品的经测量的比例贡献和所述对应相对丰度。8.根据权利要求7所述的方法,其中所述一个或多个校准数据点是多个校准数据点,所述多个校准数据点形成接近所述多个校准数据点的校准函数。9.根据权利要求2所述的方法,其中所述基因组位置的第一集合的每个基因组位置具有至少指定数目的结束于所述基因组位置上的所述第二多个游离DNA分子中的游离DNA分子。10.根据权利要求2所述的方法,其中所述参考值是根据所述至少一个第一额外样品中的游离DNA分子的概率分布和平均长度,结束于所述基因组窗口内的游离DNA分子的预期数目。11.根据权利要求10所述的方法,其中所述概率分布是泊松分布,且其中确定结束于所述基因组窗口内的一个或多个基因组位置上的游离DNA分子的比率是否高于所述阈值包括:使用所述对应数目和所述预期数目确定对应p值,其中所述阈值对应于截止p值,所述对应p值小于所述截止p值指示结束于所述基因组窗口内的游离DNA分子的比率高于所述阈值。12.根据权利要求2所述的方法,其中结束于所述基因组位置上的所述第二多个游离DNA分子的比率高于所述阈值的所述基因组位置包含第一超集,且其中识别所述基因组位置的第一集合还包括:通过所述计算机系统分析来自至少一个第二额外样品的第三多个游离DNA分子,以识别结束于所述基因组位置上的所述第三多个游离DNA分子中高于所述阈值的第二超集,所述第二额外样品被识别为具有减少量的所述第一组织类型;且将所述基因组位置的第一集合识别为包括在所述第一超集中且不在所述第二超集中的所述基因组位置。13.根据权利要求2所述的方法,其中所述参考值包括结束于所述基因组窗口内的游离DNA分子的测量数目,所述测量数目由识别为不具有所述第一组织类型的至少一个第二额外样品的第三多个游离DNA分子确定。14.根据权利要求13所述的方法,其还包括:确定所述第二多个游离DNA分子中的每一个的尺寸,其中识别所述基因组位置的第一集合还包括:确定所述第二多个游离DNA分子中结束于第一基因组位置上的游离DNA分子的第一尺寸分布的第一统计值,所述第一基因组位置经确定具有高于所述阈值的所述比率;确定所述第三多个游离DNA分子中结束于一个或多个第二基因组位置上的游离DNA分子的第二尺寸分布的第二统计值,所述第二基因组位置经确定具有高于所述阈值的所述比率;比较所述第一统计值与第二统计值;以及当所述第一统计值不超过所述第二统计值至少指定量时,从所述基因组位置的第一集合排除所述第一基因组位置,所述指定量指示所述第一尺寸分布小于所述第二尺寸分布。15.根据权利要求13所述的方法,其中比较所述对应数目与所述参考值包括:计算所述对应数目与覆盖所述基因组窗口的所述第二多个游离DNA分子的第三数目的第一比率;以及比较所述第一比率与所述参考值,所述参考值包括结束于所述基因组窗口内的读取的所述测量数目与覆盖所述基因组窗口且不结束于所述基因组窗口内的所述第三多个游离DNA分子的第四数目的参考比率。16.根据权利要求15所述的方法,其中所述第三数目的所述第二多个游离DNA分子不结束于所述基因组窗口内。17.根据权利要求15所述的方法,其中确定结束于所述基因组窗口内的游离DNA分子的比率是否高于所述阈值包括:确定所述第一比率是否大于相乘因数乘以所述参考比率。18.根据权利要求2所述的方法,其中所述生物样品和所述至少一个第一额外样品的所述样品类型选自:血浆、血清、脑脊髓液和尿液。19.根据权利要求2所述的方法,其中所述基因组窗口为基因组位置,且其中所述第一组织类型具有多个第一组织特异性等位基因,且其中计算结束于所述基因组位置上的所述第二多个游离DNA分子的所述对应数目包括:识别结束于所述基因组位置上的所述游离DNA分子是否包括所述多个第一组织特异性等位基因中的至少一个;当所述游离DNA分子包括第一组织特异性等位基因时,在所述对应数目中包括所述游离DNA分子;且当所述游离DNA分子不包括第一组织特异性等位基因时,在所述对应数目中不包括所述游离DNA分子。20.根据权利要求1所述的方法,其中所述第一组织类型在至少一个额外样品中具有多个第一组织特异性等位基因,且其中所述基因组位置的第一集合使用所述至少一个额外样品中包括所述多个第一组织特异性等位基因中的至少一个的游离DNA分子来确定。21.根据权利要求20所述的方法,其中所述基因组位置的第二集合使得第二组织类型的游离DNA分子的末端以高于所述阈值的比率出现于所述至少一个额外样品中,其中所述第二组织类型在所述至少一个额外样品中具有多个第二组织特异性等位基因,且其中所述基因组位置的第二集合使用所述至少一个额外样品中包括所述多个第二组织特异性等位基因中的至少一个的游离DNA分子确定。22.根据权利要求21所述的方法,其中所述至少一个额外样品来自怀孕女性,且其中所述第一组织类型为胎儿组织且所述第二组织类型为母体组织。23.根据权利要求21所述的方法,其中将具有所述第一组织类型与所述第二组织类型的共用等位基因的游离DNA分子的末端以高于所述阈值的第二比率出现的基因组位置,从所述基因组位置的第一集合排除且从所述基因组位置的第二集合排除。24.根据权利要求1所述的方法,其中所述相对丰度包括所述第一数目与所述第二数目的比率。25.根据权利要求1所述的方法,其中所述多个窗口具有一个基因组位置的宽度,且其中所述相对丰度通过如下计算:对于所述基因组位置的第一集合中的每个基因组位置:计算结束于所述基因组位置上的所述第一多个游离DNA分子的对应数目,作为确定所述第一数目的所述第一多个游离DNA分子结束于所述基因组位置的第一集合中的任一个上的一部分;计算覆盖所述基因组位置且不结束于所述基因组位置上的所述第一多个游离DNA分子的第三数目,作为确定游离DNA分子的所述第二数目的一部分;计算所述对应数目与所述第三数目的第一比率;计算所述第一比率的平均值作为所述相对丰度。26.根据权利要求1所述的方法,其中所述相对丰度通过如下计算:对于所述基因组位置的第一集合中的每个基因组位置:计算结束于包括所述基因组位置的第一窗口内的所述第一多个游离DNA分子的对应数目,作为确定所述第一数目的所述第一多个游离DNA分子结束于所述多个窗口中的一个内的一部分;计算结束于包括所述基因组位置的第二窗口内的所述第一多个游离DNA分子的第三数目,所述第二窗口大于所述第一窗口;计算所述对应数目与所述第三数目的第一比率;计算所述第一比率的平均值作为所述相对丰度。27.根据权利要求1所述的方法,其中所述基因组位置的第二集合与所述基因组位置的第一集合不重叠。28.根据权利要求1所述的方法,其中所述基因组位置的第二集合包括对应于所述第一多个游离DNA分子中的至少一个的末端的所有基因组位置。29.根据权利要求1所述的方法,其中分析所述游离DNA分子中的一个或多个包括确定对应于所述游离DNA分子的两个末端的两个基因组位置。30.根据权利要求1所述的方法,其中所述比例贡献的分类对应于高于指定百分比的范围。31.根据权利要求1所述的方法,其中所述第一组织类型为肿瘤。32.根据权利要求31所...

【专利技术属性】
技术研发人员:卢煜明赵慧君陈君赐江培勇
申请(专利权)人:香港中文大学
类型:发明
国别省市:中国香港,81

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1