使用孕妇体内的长游离片段进行的分子分析制造技术

技术编号:37392610 阅读:29 留言:0更新日期:2023-04-27 07:30
本文所描述的方法和系统涉及使用长游离DNA片段分析来自怀孕个体的生物样本。常常使用甲基化CpG位点和单核苷酸多型性(SNP)的状态分析生物样本的DNA片段。CpG位点和SNP通常与最近的CpG位点或SNP间隔数百个或数千个碱基对。在大部分游离DNA片段上找到两个或更多个连续CpG位点或SNP是不大可能或不可能的。长于600bp的游离DNA片段可包含多个CpG位点和/或SNP。与单独短游离DNA片段相比,在长游离DNA片段上存在多个CpG位点和/或SNP可允许进行分析。长游离DNA片段可用于识别起源组织和/或用于提供关于怀孕女性体内胎儿的信息。于提供关于怀孕女性体内胎儿的信息。于提供关于怀孕女性体内胎儿的信息。

【技术实现步骤摘要】
使用孕妇体内的长游离片段进行的分子分析
[0001]本申请是基于中国专利申请第202180013180.5号的分案申请。
[0002]相关申请的交叉引用
[0003]本申请要求2020年2月5日提交的美国临时申请第62/970,634号和2021年1月8日提交的美国临时申请第63/135,486号的优先权,所述两案的全部内容出于所有目的并入本文中。

技术介绍

[0004]已报告孕妇体内的循环游离DNA的模态尺寸为约166bp(Lo等人《科学转化医学(Sci Transl Med.)》2010;2:61ra91)。存在极少关于大于600bp的片段的公布数据。一个实例为报告使用PCR进行的来自母体血浆的Y染色体的碱性蛋白Y2基因(BPY2)的8kb片段扩增的Amicucci等人的作品(Amicucci等人《临床化学(Clin Chem)》2000;40:301

2)。尚不知晓所述数据是否可在整个基因组中通用。实际上,使用大规模平行短读段测序技术,例如使用Illumina平台检测例如大于600bp的所述长DNA片段存在许多挑战(Lo等人《科学转化医学》2010;2:61ra91;Fan等人,《临床化学》2010;56:1278

86)。这些挑战包含:(1)Illumina测序平台的推荐尺寸范围跨度通常为100

300bp(De Maio等人《微生物基因组学(Micob Genom.)》2019;5(9));(2)DNA扩增应参与在流量槽上的测序文库制备(经由PCR)或测序集群生成(经由桥式扩增)。此类扩增过程可促进扩增较短DNA片段,此部分归因于以下事实:长DNA模板(例如>600bp)应需要相较于短DNA模板(例如<200bp)而言相对长的时间来完成子股合成。因此,在于Illumina平台上测序之前或期间的这些PCR过程的固定时间框内,子股未能在PCR过程期间完全生成的那些长DNA分子将在下游分析中不可用;(3)长DNA分子将具有更大概率形成妨碍扩增的二级结构;(4)使用Illumina测序技术,长DNA分子将相较于短DNA分子而言更可能产生含有超过一个克隆DNA分子的集群,这是因为文库被变性、稀释且扩散在二维表面上,接着进行桥式扩增(Head等人《生物技术(Biotechniques.)》2014;56:61

4)。

技术实现思路

[0005]本文所描述的方法和系统涉及使用长游离DNA片段分析生物样本。使用这些长游离DNA片段允许进行未考虑的分析或用较短游离DNA片段不可能进行的分析。常常使用甲基化CpG位点和单核苷酸多型性(SNP)的状态分析生物样本的DNA片段。CpG位点和SNP通常与最近的CpG位点或SNP间隔数百个或数千个碱基对。生物样本中的大部分游离DNA片段的长度通常小于200bp。因此,在大部分游离DNA片段上找到两个或更多个连续CpG位点或SNP是不大可能或不可能的。包含长于600bp或1kb的游离DNA片段的长于200bp的游离DNA片段可包含多个CpG位点和/或SNP。与单独短游离DNA片段相比,在长游离DNA片段上存在多个CpG位点和/或SNP可允许进行更高效和/或更准确的分析。长游离DNA片段可用于识别起源组织且/或用于提供关于怀孕女性体内胎儿的信息。另外,使用长游离DNA片段准确地分析来自孕妇的样本是出乎意料的,这是因为我们预期所述长游离DNA片段主要是母体起源。我们不
预期胎儿起源的长游离DNA片段以足以提供关于胎儿的信息的量存在。
[0006]存在有SNP的长游离DNA片段可用于确定胎儿遗传的单倍型。长游离DNA片段通过具有多个CpG位点而可具有指示起源组织的甲基化模式。另外,三核苷酸重复序列和其它重复序列可存在于长游离DNA片段上。这些重复序列可用于确定胎儿的遗传病症的可能性或胎儿亲缘。长游离DNA片段的量可用于确定胎龄。类似地,在长游离DNA片段的末端处的基序也可用于确定胎龄。长游离DNA片段(包含例如所述片段的量、长度分布、基因组位置、甲基化状态等)可用于确定怀孕相关病症。
[0007]本公开的这些和其它实施例详细描述于下文中。举例来说,其它实施例涉及与本文所描述的方法相关的系统、装置和计算机可读媒体。
[0008]可参考以下具体实施方式和附图来获得对本公开的实施例的性质和优点的更好理解。
[0009]作为非限制性实例,本申请提供了以下实施方案:
[0010]实施方案1.一种分析获自怀有胎儿的女性的生物样本的方法,所述女性在第一染色体区中具有第一单倍型和第二单倍型,所述生物样本包含来自所述胎儿和所述女性的多个游离DNA分子,所述方法包括:
[0011]接收对应于所述多个游离DNA分子的读段;
[0012]测量所述多个游离DNA分子的尺寸;
[0013]识别来自所述多个游离DNA分子的第一组游离DNA分子为具有大于或等于截止值的尺寸;
[0014]由对应于所述第一组游离DNA分子的读段确定所述第一单倍型的序列和所述第二单倍型的序列;
[0015]将来自所述多个游离DNA分子的第二组游离DNA分子与所述第一单倍型的所述序列进行比对,所述第二组游离DNA分子具有小于所述截止值的尺寸;
[0016]将来自所述多个游离DNA分子的第三组游离DNA分子与所述第二单倍型的所述序列进行比对,所述第三组游离DNA分子具有小于所述截止值的尺寸;
[0017]使用所述第二组游离DNA分子测量参数的第一值;
[0018]使用所述第三组游离DNA分子测量所述参数的第二值;
[0019]比较所述第一值与所述第二值;和
[0020]基于所述第一值与所述第二值的所述比较确定所述胎儿遗传所述第一单倍型的可能性。
[0021]实施方案2.根据实施方案1所述的方法,其中所述截止值为600nt。
[0022]实施方案3.根据实施方案1所述的方法,其中所述截止值为1knt。
[0023]实施方案4.根据实施方案1至3中任一项所述的方法,其中由对应于所述第一组游离DNA分子的所述读段确定所述第一单倍型的所述序列和所述第二单倍型的所述序列包括:
[0024]将对应于所述第一组游离DNA分子的读段与参考基因组进行比对。
[0025]实施方案5.根据实施方案1所述的方法,其中由对应于所述第一组游离DNA分子的所述读段确定所述第一单倍型的所述序列和所述第二单倍型的所述序列包括:
[0026]将所述读段的第一子组与所述读段的第二子组进行比对以识别所述读段中的基
因座处的不同等位基因,
[0027]确定所述读段的所述第一子组在所述基因座处具有第一等位基因,
[0028]确定所述读段的所述第二子组在所述基因座处具有第二等位基因,
[0029]确定所述读段的所述第一子组对应于所述第一单倍型,和
[0030]确定所述读段的所述第二子组对应于所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分析获自怀有胎儿的女性的生物样本的方法,所述女性在第一染色体区中具有第一单倍型和第二单倍型,所述生物样本包含来自所述胎儿和所述女性的多个游离DNA分子,所述方法包括:接收对应于所述多个游离DNA分子的读段;测量所述多个游离DNA分子的尺寸;识别来自所述多个游离DNA分子的第一组游离DNA分子为具有大于或等于截止值的尺寸,其中所述截止值为至少500nt;用对应于所述第一组游离DNA分子的读段确定所述第一单倍型的序列和所述第二单倍型的序列;将来自所述多个游离DNA分子的第二组游离DNA分子与所述第一单倍型的所述序列进行比对,所述第二组游离DNA分子具有小于所述截止值的尺寸;将来自所述多个游离DNA分子的第三组游离DNA分子与所述第二单倍型的所述序列进行比对,所述第三组游离DNA分子具有小于所述截止值的尺寸;使用所述第二组游离DNA分子测量参数的第一值;使用所述第三组游离DNA分子测量所述参数的第二值;比较所述第一值与所述第二值;和基于所述第一值与所述第二值的所述比较确定所述胎儿遗传所述第一单倍型的可能性。2.根据权利要求1所述的方法,其中所述截止值为600nt。3.根据权利要求1所述的方法,其中所述截止值为1knt。4.根据权利要求1所述的方法,其中由对应于所述第一组游离DNA分子的所述读段确定所述第一单倍型的所述序列和所述第二单倍型的所述序列包括:将对应于所述第一组游离DNA分子的读段与参考基因组进行比对。5.根据权利要求1所述的方法,其中由对应于所述第一组游离DNA分子的所述读段确定所述第一单倍型的所述序列和所述第二单倍型的所述序列包括:将所述读段的第一子组与所述读段的第二子组进行比对以识别所述读段中的基因座处的不同等位基因,确定所述读段的所述第一子组在所述基因座处具有第一等位基因,确定所述读段的所述第二子组在所述基因座处具有第二等位基因,确定所述读段的所述第一子组对应于所述第一单倍型,和确定所述读段的所述第二子组对应于所述第二单倍型。6.根据权利要求1所述的方法,其中所述参数为游离DNA分子计数、游离DNA分子尺寸概况或游离DNA分子甲基化程度。7.根据权利要求6所述的方法,其中:所述参数为所述游离DNA分子计数,且所述方法进一步包括:当所述第一值大于所述第二值时,确定所述胎儿遗传所述第一单倍型的可能性高于遗传所述第二单倍型的可能性。8.根据权利要求6所述的方法,其中:
所述参数为所述游离DNA分子尺寸概况,且所述方法进一步包括:当所述第一值小于所述第二值时,确定所述胎儿遗传所述第一单倍型的可能性高于遗传所述第二单倍型的可能性,指示所述第二组游离DNA分子的特征在于小于所述第三组游离DNA分子的尺寸概况。9.根据权利要求6所述的方法,其中:所述参数为所述游离DNA分子甲基化程度,且所述方法进一步包括:当所述第一值小于所述第二值时,确定所述胎儿遗传所述第一单倍型的可能性高于遗传所述第二单倍型的可能性。10.根据权利要求1所述的方法,其中所述截止值是第一截止值,所述方法进一步包括:使用所述第一值和所述第二值计算分离值;比较所述分离值与第二截止值;和基于所述分离值与所述第二截止值的所述比较...

【专利技术属性】
技术研发人员:卢煜明赵慧君陈君赐江培勇郑淑恒余烁妍张尔庭彭文磊
申请(专利权)人:香港中文大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1