当前位置: 首页 > 专利查询>格里尔公司专利>正文

游离DNA末端特征制造技术

技术编号:29941208 阅读:44 留言:0更新日期:2021-09-08 08:21
本公开描述了用于测量生物体的生物样本中的游离DNA片段的序列末端基序的量(例如,相对频率)以测量样本的特性(例如,临床相关DNA的浓度分数)和/或基于此类测量来确定生物体的状况的技术。不同的组织类型表现出序列末端基序的相对频率的不同模式。本公开提供了用于测量例如在来自各种组织的游离DNA的混合物中的游离DNA的序列末端基序的相对频率的各种用途。来自此类组织中的一者的DNA可以被称为临床相关的DNA。床相关的DNA。床相关的DNA。

【技术实现步骤摘要】
【国外来华专利技术】游离DNA末端特征
相关申请的交叉引用
[0001]本申请是2018年12月19日提交的名称为“CELL

FREE DNA END CHARACTERISTICS”的美国临时专利申请号62/782,316的PCT并要求其权益,该美国临时专利申请出于所有目的而全文以引用方式并入本文。

技术介绍

[0002]血浆DNA被认为由从体内的多种组织脱落的游离DNA组成,所述多种组织包括但不限于造血组织、脑、肝、肺、结肠、胰腺等(Sun等人,Proc Natl Acad Sci USA.2015;112:E5503

12;Lehmann

Werman等人,Proc Natl Acad Sci USA.2016;113:E1826

34;Moss等人,Nat Commun.2018;9:5068)。血浆DNA分子(一种游离DNA分子)已被证明是通过非随机过程生成的,例如,其大小分布显示有166bp的主要峰和在较小峰中存在的10bp周期性(Lo等人,Sci Transl Med.2010;2:61ra91;Jiang等人,Proc Natl Acad Sci USA.2015;112:E1317

25)。
[0003]最近,据报道人类基因组位置的子集(例如,参考基因组上的位置)被优先切割,从而生成血浆DNA片段,所述血浆DNA片段的末端位置与起源组织有关系(Chan等人,Proc Natl Acad Sci USA.2016;113:E8159

8168;Jiang等人,Proc Natl Acad Sci USA.2018;doi:10.1073/pnas.1814616115)。Chandrananda等人(BMC Med Genomics.2015;8:29)使用从头探索软件DREME(Bailey,Bioinformatics.2011;27:1653

9)来挖掘与核酸酶切割相关的基序的游离DNA数据,而与组织类型无关。

技术实现思路

[0004]本公开描述了用于测量生物体的生物样本中的游离DNA片段的序列末端基序的量(例如,相对频率)以测量样本的特性(例如,临床相关DNA的浓度分数)和/或基于此类测量来确定生物体的状况的技术。不同的组织类型表现出序列末端基序的相对频率的不同模式。本公开提供了用于测量例如在来自各种组织的游离DNA的混合物中的游离DNA的序列末端基序的相对频率的各种用途。来自此类组织中的一者的DNA可以被称为临床相关的DNA。
[0005]各种示例可以量化代表DNA片段的末端序列的序列基序(末端基序)的量。例如,实施方式可以确定DNA片段的末端序列的一组序列基序的相对频率。在各种实施方式中,可以使用基因型(例如,组织特异性等位基因)或表型方法(例如,使用具有相同条件的样本)来确定优选的末端基序集合和/或末端基序模式。优选集合或具有特定模式的相对频率可用于测量新样本或生物体的条件(例如,胎儿的胎龄或病理学水平)的特性(例如,临床相关DNA的浓度分数)的分类。因此,实施方式可以提供测量以告知生理改变,包括癌症、自体免疫性疾病、移植和怀孕。
[0006]作为进一步的示例,序列末端基序可用于对生物样本进行临床相关的游离DNA片段的物理富集和/或计算机模拟富集。富集可以使用对临床相关组织(例如胚胎、肿瘤或移植物)优选的序列末端基序。物理富集可以使用一种或多种探针分子,该一种或多种探针分
子检测一组特定的序列末端基序,使得生物学样本富集临床相关的DNA片段。对于计算机模拟富集,可以鉴定游离DNA片段的一组序列读数,所述片段具有临床相关DNA的一组优选末端序列中的一个末端序列。可以基于与临床相关DNA对应的可能性来存储某些序列读数,其中该可能性解释了包括优选的序列末端基序的序列读数。可以分析所存储的序列读数以确定生物样本中的临床相关DNA的特性。
[0007]下文详细描述了本公开的这些和其它实施方式。例如,其它实施方式针对与本文所描述的方法相关联的系统、设备和计算机可读介质。
[0008]可以参考以下详细描述和附图来更好地了解本公开实施方式的性质和优点。
附图说明
[0009]图1示出了根据本公开的实施方式的末端基序的示例。
[0010]图2示出了根据本公开的实施方式的用于分析胎儿DNA分子与母体DNA分子之间的差异末端基序模式的基于基因型差异的方法的示意图。
[0011]图3示出了根据本公开的实施方式的胎儿DNA分子与母体DNA分子之间的末端基序频率的条形图。
[0012]图4示出了根据本公开的实施方式的胎儿和共享的(即,胎儿加母体的)序列的来自图3的前10个末端基序。
[0013]图5A和图5B示出了根据本专利技术的实施方式的孕妇中的胎儿DNA分子与母体DNA分子之间的熵的箱线图。
[0014]图6A和图6B示出了根据本公开的实施方式的胎儿DNA分子和母体DNA分子的分层聚类分析。
[0015]图7A和图7B示出了根据本公开的实施方式的使用孕妇的所有基序跨不同的三个月时间的熵分布。图7C和图7D示出了根据本公开的实施方式的使用孕妇的10个基序跨不同的三个月时间的熵分布。
[0016]图8A示出了所有片段跨不同胎龄的熵。第3个三个月时间的受试者中的血浆DNA片段的熵被证明低于(p值=0.06)第1个三个月时间和第2个三个月时间的所述受试者中的血浆DNA片段的熵。图8B示出了Y染色体源的片段跨不同胎龄的熵。第3个三个月时间的受试者中的Y染色体源的片段的熵被证明低于(p值=0.01)第1个三个月时间和第2个三个月时间的所述受试者中的Y染色体源的片段的熵。
[0017]图9和图10示出了根据本公开的实施方式在胎儿DNA分子与母体DNA分子之间的排名前10的末端基序跨不同的三个月时间的分布。
[0018]图11示出了根据本公开的实施方式在胎儿分子与共享分子之间的前10个排名的基序跨不同的三个月时间的组合频率。
[0019]图12示出了根据本公开的实施方式的用于分析癌症患者的血浆DNA中的突变分子与共享分子之间的差异末端基序模式的基于基因型差异的方法的示意图。
[0020]图13示出了根据本公开的实施方式的肝细胞癌中的癌症相关联的突变体分子和共享分子的血浆DNA末端基序的景观。
[0021]图14示出了根据本公开的实施方式的肝细胞癌中的癌症相关联的突变分子和共享分子的血浆DNA末端基序的径向景观。
[0022]图15A示出了根据本公开的实施方式的在HCC患者的血浆DNA中的突变序列与共享序列之间的末端基序频率的排名差异中的前10个末端基序。
[0023]图15B示出了根据本公开实施方式的HCC患者和怀孕女性的8个末端基序的组合频率。
[0024]图16A和图16B示出了根据本公开的实施方式的针对HCC病例的不同末端基序集合的共享片段和突变片段本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种对受试者的生物样本中的病理水平进行分类的方法,所述生物样本包含游离DNA,所述方法包括:分析来自所述生物样本的多个游离DNA片段以获得序列读数,其中所述序列读数包括与所述多个游离DNA片段的末端对应的末端序列;对于所述多个游离DNA片段中的每一个游离DNA片段,确定所述游离DNA片段的一个或多个末端序列中的每一个末端序列的序列基序;确定与所述多个游离DNA片段的所述末端序列对应的一个或多个序列基序的集合的相对频率,其中序列基序的相对频率提供了具有与所述序列基序对应的末端序列的所述多个游离DNA片段的比例;确定所述一个或多个序列基序的集合的所述相对频率的合计值;以及基于所述合计值与参考值的比较来确定所述受试者的病理水平的分类。2.根据权利要求1所述的方法,所述方法还包括:过滤所述游离DNA以鉴定所述多个游离DNA片段。3.根据权利要求2所述的方法,其中所述过滤是基于DNA片段的大小或DNA片段所来源于的区域。4.根据权利要求3所述的方法,其中过滤所述游离DNA以获得来自特定组织的开放染色质区域的DNA片段。5.根据权利要求1所述的方法,其中所述病理学是癌症。6.根据权利要求5所述的方法,其中所述癌症是肝细胞癌、肺癌、乳腺癌、胃癌、多形性成胶质细胞瘤、胰腺癌、结直肠癌、鼻咽癌、和头颈鳞状细胞癌。7.根据权利要求5所述的方法,其中所述分类是根据包括多个癌症时期的多个癌症水平确定的。8.根据权利要求1所述的方法,其中所述病理学是自体免疫性疾患。9.根据权利要求8所述的方法,其中所述自体免疫性疾患是系统性红斑狼疮。10.根据权利要求1所述的方法,其中所述病理水平对应于与所述病理学相关联的临床相关DNA的浓度分数。11.一种估计受试者的生物学样本中的临床相关DNA的浓度分数的方法,所述生物学样本包含临床相关DNA和其它游离DNA,所述方法包括:分析来自所述生物样本的多个游离DNA片段以获得序列读数,其中所述序列读数包括与所述多个游离DNA片段的末端对应的末端序列;对于所述多个游离DNA片段中的每一个游离DNA片段,确定所述游离DNA片段的一个或多个末端序列中的每一个末端序列的序列基序;确定与所述多个游离DNA片段的所述末端序列对应的一个或多个序列基序的集合的相对频率,其中序列基序的相对频率提供了具有与所述序列基序对应的末端序列的所述多个游离DNA片段的比例;确定所述一个或多个序列基序的集合的所述相对频率的合计值;以及通过将所述合计值与从临床相关DNA浓度分数已知的一个或多个校准样本中确定的一个或多个校准值进行比较,来确定所述生物样本中的所述临床相关DNA浓度分数的分类。12.根据权利要求11所述的方法,其中所述临床相关DNA选自由以下项组成的组:胎儿
DNA、肿瘤DNA、来自移植器官的DNA、和特定组织类型。13.根据权利要求11所述的方法,其中所述临床相关DNA具有特定的组织类型。14.根据权利要求13所述的方法,其中所述特定组织类型是肝脏或造血系统的。15.根据权利要求11所述的方法,其中所述受试者是怀孕的女性,并且其中所述临床相关DNA是胎盘组织。16.根据权利要求11所述的方法,其中所述临床相关DNA是来源于患有癌症的器官的肿瘤DNA。17.根据权利要求11所述的方法,其中所述一个或多个校准值是使用多个校准样本的临床相关DNA的浓度分数确定的校准函数的多个校准值。18.根据权利要求11所述的方法,其中所述一个或多个校准值对应于使用所述一个或多个校准样本中的游离DNA片段测量的所述一个或多个序列基序的集合的所述相对频率的一个或多个合计值。19.根据权利要求11所述的方法,所述方法还包括:针对所述一个或多个校准样本中的每个校准样本:测量所述校准样本中的所述临床相关DNA浓度分数;以及通过作为获得校准数据点的一部分分析来自所述校准样本的游离DNA片段,从而确定一个或多个合计值,来确定所述一个或多个序列基序的集合的所述相对频率的所述合计值,其中每个校准数据点指定所述校准样本中的所述测量的临床相关DNA浓度分数和针对所述校准样本确定的合计值,并且其中所述一个或多个校准值是所述一个或多个合计值或者是使用所述一个或多个合计值确定的。20.根据权利要求19所述的方法,其中使用特定于所述临床相关DNA的等位基因来执行测量所述校准样本中所述临床相关DNA浓度分数。21.一种通过分析来自怀有胎儿的女性受试者的生物样本来确定胎儿的胎龄的方法,所述生物样本包括来自所述女性受试者和所述胎儿的游离DNA分子,所述方法包括:分析来自所述生物样本的多个游离DNA片段以获得序列读数,其中所述序列读数包括与所述多个游离DNA片段的末端对应的末端序列;对于所述多个游离DNA片段中的每一个游离DNA片段,确定所述游离DNA片段的一个或多个末端序列中的每一个末端序列的序列基序;确定与所述多个游离DNA片段的所述末端序列对应的一个或多个序列基序的集合的相对频率,其中序列基序的相对频率提供了具有与所述序列基序对应的末端序列的所述多个游离DNA片段的比例;确定所述一个或多个序列基序的集合的所述相对频率的合计值;获得一个或多个校准数据点,其中每个校准数据点指定与合计值对应的胎龄,并且其中所述一个或多个校准数据点是从多个具有已知胎龄并且包括游离DNA分子的校准样本确定的;将所述合计值与至少一个校准数据点的校准值进行比较;以及基于所述比较估计所述胎儿的胎龄。22.根据权利要求21所述的方法,其中所述一个或多个校准数据点是多个校准数据点,所述多个校准数据点形成校准函数,所述函数近似于从具有已知胎龄的所述多个校准样本
中的所述游离DNA分子确定的测量的合计值。23.根据权利要求21所述的方法,其中将所述合计值与多个校准值进行比较,每个校准值对应于所述多个校准样本中的一个校准样本。24.根据权利要求21所述的方法,其中所述至少一个校准数据点的所述校准值对应于使用所述多个校准样本中的至少一个校准样本中的所述游离DNA分子测量的所述合计值。25.根据权利要求21所述的方法,所述方法还包括:将所述多个游离DNA片段鉴定为来源于所述胎儿。26.根据权利要求25所述的方法,其中使用胎儿特异性等位基因或胎儿特异性表观遗传标记物鉴定所述多个游离DNA片段。27.根据权利要求25所述的方法,其中所述多个游离DNA片段是通过以下方式鉴定的:对于所述序列读数中的每个序列读数:基于包括所述一个或多个序列基序的集合中...

【专利技术属性】
技术研发人员:卢煜明赵慧君陈君赐江培勇陈颖欣孙坤
申请(专利权)人:格里尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1