用于检测胎儿亚染色体畸变的母体血浆的组合的基于尺寸和基于计数的分析制造技术

技术编号:32550309 阅读:21 留言:0更新日期:2022-03-05 11:49
可以通过分析胎儿和母体DNA的样本来识别胎儿基因组中的畸变。使用基于计数和基于尺寸的方法确定亚染色体区域中是否存在畸变(扩增或缺失)的分类。可以组合使用计数分类和尺寸分类以确定仅胎儿或仅母亲或两者在亚染色体区域中是否具有畸变,从而避免当母体具有畸变而胎儿不存在时的假阳性。而胎儿不存在时的假阳性。而胎儿不存在时的假阳性。

【技术实现步骤摘要】
用于检测胎儿亚染色体畸变的母体血浆的组合的基于尺寸和基于计数的分析
[0001]相关申请的交叉参考
[0002]本申请是申请号为201680006999.8的中国专利申请的分案申请,并且要求2015年 1月23日提交的题为“用于检测胎儿亚染色体畸变的母体血浆的组合的基于尺寸和计数的分析(Combined Size

and Count

Based Analysis Of Maternal Plasma For Detection OfFetal Subchromosomal Aberrations)”的美国临时申请号62/107,227的优先权,其全部内容出于所有目的以引用的方式并入文中。本申请也涉及2008年7月23日提交的Lo等人的题为“使用大规模平行基因组测序诊断胎儿染色体非整倍性(Diagnosing FetalChromosomal Aneuploidy Using Massively Parallel Genomic Sequencing)”的美国专利公布 2009/0029377;以及2010年11月5日提交的Lo等人的题为“基于尺寸的基因组分析 (Size

Based Genomic Analysis)”的美国专利号8,620,593,其全部内容出于所有目的以引用的方式并入。

技术介绍

[0003]母体血浆中的无细胞DNA包含胎儿DNA和母体DNA的混合物。母体血浆的非侵入式产前测量可用于通过从亚染色体区域计数DNA片段来检测亚染色体拷贝数畸变 (CNA)。但是,计数并不将胎儿DNA与母体DNA区分开。因此,通过计数DNA片段检测的畸变可以从胎儿或母亲得到。因此,当一个母亲自身是CNA的载体时,无法辨别她的胎儿是否遗传了CNA。此外,当分析更多的亚染色体区域时,假阳性结果将变得更加普遍。
[0004]实施例可以解决这些和其它问题。

技术实现思路

[0005]实施例使用结合基于计数和基于尺寸的母体样本分析(包括母体DNA和胎儿DNA) 以检测胎儿亚染色体拷贝数畸变(CNA)的策略。可以使用基于计数的分析来检测区域中的CNA。DNA分子的基于尺寸的分析也可以用于分析确定为具有CNA的区域,其中基于尺寸的分析可用于将源于胎儿或母体,或源于两者的畸变区分开。
[0006]其它实施例涉及与本文所述的方法相关的系统和计算机可读介质。
[0007]参考以下具体实施方式和附图,可以更好地理解本专利技术实施例的性质和优点。
附图说明
[0008]图1显示了根据本专利技术的实施例的用于基于计数和基于尺寸的结果的组合的六个情形的表100。
[0009]图2显示了根据本专利技术的实施例的在胎儿的染色体2上的区域中具有拷贝数增益的病例的组合的基于计数和基于尺寸的分析的示例性处理流程。
[0010]图3是根据本专利技术的实施例的通过分析来自怀有胎儿的雌性受试者的生物样本来识别胎儿的胎儿基因组中的亚染色体畸变的方法300的流程图。
[0011]图4显示了根据本专利技术的实施例的用于基于计数和基于尺寸的结果以及F
CNA
值的组合的六个情形的表400。
[0012]图5是显示六个母体血浆DNA样本的基于计数的分数和基于尺寸的分数以说明本专利技术的实施例的准确度的表500。
[0013]图6是显示关于来自胎儿或母亲或两者的CNA的6个病例的信息的表600。
[0014]图7显示根据本专利技术的实施例的表600中六个病例的母体血浆DNA的组合的基于计数和基于尺寸的分析。
[0015]图8是显示根据本专利技术的实施例的在每个病例中没有可检测的CNA的测试区域的基于计数和基于尺寸的z分数的表800。
[0016]图9是显示根据本专利技术的实施例的通过分割方法确定的由100

kb单元组成的扩增区域的图900。
[0017]图10是显示根据本专利技术的实施例的通过分割方法确定的由100

kb单元组成的缺失区域的图1000。
[0018]图11显示了可用于根据本专利技术的实施例的系统和方法的示例性计算机系统10的框图。
具体实施方式
[0019]术语
[0020]本文所用的术语“生物样本”是指从受试者(例如人,例如孕妇)取得并含有一种或多种所感兴趣的核酸分子的任何样本。实例包括血浆、唾液、胸膜液、汗液、腹水、胆汁、尿液、血清、胰液、粪便和子宫颈涂片样本
[0021]术语“核酸”或“多核苷酸”是指单链或双链形式的脱氧核糖核酸(DNA)及其聚合物。除非具体地限定,否则该术语包括含有天然核苷酸的已知类似物的核酸,其具有与参考核酸相似的结合特性并且以类似于天然存在的核苷酸的方式进行代谢。除非另有说明,特定的核酸序列也隐含地涵盖其保守修饰的变体(例如,简并密码子取代)、等位基因、直向同源物、单核苷酸多态性(SNP)和互补序列以及明确指出的序列。具体地,简并密码子取代可以通过产生其中一个或多个所选(或全部)密码子的第三位置被混合碱基和/或脱氧肌苷残基取代的序列来实现(Batzer MA等人,Nucleic Acid Res 1991;19:5081; Ohtsuka E等人,J Biol Chem 1985;260:2605

2608;和Rossolini GM等人,Mol Cell Probes1994;8:91

98)。
[0022]术语“序列读取”是指从全部或部分核酸分子获得的序列,例如DNA片段。在一个实施例中,仅对片段的一端进行测序,例如约30个碱基。然后将测序的读数与参考基因组对比。或者,可以对片段的两端进行测序以产生两个测序读数,其可以提供更高的比对准确度并且还提供该片段的长度。在又另一个实施例中,线性DNA片段可以例如通过连接进行环化,并且可以对跨越连接位点的部分进行测序。
[0023]术语分数胎儿DNA浓度可与术语胎儿DNA比例和胎儿DNA部分互换使用,并且是指存在于从胎儿得到的母体血浆或血清样本中的DNA分子的比例(Lo YMD等人,AmJ Hum Genet 1998;62:768

775;Lun FMF等人,Clin Chem 2008;54:1664

1672)。
[0024]术语“尺寸分布”通常涉及生物样本中DNA片段的尺寸。尺寸分布可以是提供多种
尺寸的DNA片段的分布的直方图。可使用各种统计参数(也称为尺寸参数或只是参数) 来将一个尺寸分布与另一个尺寸分布区分开。一个参数是特定尺寸或尺寸范围的DNA 片段相对于所有DNA片段或相对于另一个尺寸或范围的DNA片段的百分比。
[0025]本文所用的术语“参数”意指表征定量数据集的数值和/或定量数据集之间的数值关系。例如,第一量的第一核酸序列与第二量的第二核酸序列之间的比例(或比例的函数) 是参数。
[0026]本文所用的术语“分类”是指与样本的特定性质相关的任何数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.计算机可读介质,其存储有多个指令,所述多个指令用于控制一个或多个处理器以执行通过分析来自怀有胎儿的雌性受试者的生物样品来识别胎儿的胎儿基因组中的亚染色体畸变的方法,所述生物样品包括来自雌性受试者和胎儿的无细胞DNA分子,所述方法包括:对于所述生物样本中的多个DNA分子中的每一个:识别所述DNA分子在参考基因组中的位置,从而得到所述多个DNA分子的位置;对于参考基因组中的多个非重叠单元中的每一个:使用所述多个DNA分子的位置来确定位于相应的非重叠单元中的多个DNA分子的相应量,从所述相应量计算相应的单元计数参数,以及将相应的单元计数参数与一个或多个单元计数阈值进行比较,以确定相应的非重叠单元的单元计数分类;进行分割方法,其基于具有相同的单元计数分类的连续非重叠单元将连续非重叠单元合并为合并段;将所述合并段的长度与长度阈值进行比较;根据所述合并段的非重叠单元的单元计数参数或根据位于所述合并段的非重叠单元中的多个DNA分子的量来计算所述合并段的计数参数;将所述计数参数与一个或多个偏差阈值进行比较以确定计数分类;以及基于所述合并段的长度与所述长度阈值的比较和所述计数分类,确定所述胎儿在与所述合并段对应的亚染色体区域中是否具有所述畸变。2.如权利要求1所述的计算机可读介质,其中所述分割方法包括二进制环形分割和隐马尔可夫模型中的至少一种。3.计算机系统,包括:根据权利要求1或2所述的计算机可读介质;和用于执行存储在所述计算机可读介质上的指令的一个或多个处理器。4.计算机系统,其包括用于执行通过分析来自怀有胎儿的雌性受试者的生物样品来识别胎儿的胎儿基因组中的亚染色体畸变的方法的装置,所述生物样品包括来自雌性受试者和胎儿的无细胞DNA分子,所述方法包括:对于所述生物样本中的多个DNA分子中的每一个:识别所述DNA分子在参考基因组中的位置,从而得到所述多个DNA分子的位置;对于参考基因组中的多个非重叠单元中的每一个:使用所述多个DNA分子的位置来确定位于相应的非重叠单元中的多个DNA分子的相应量,从所述相应量计算相应的单元计数参数,以及将相应的单元计数参数与一个或多个单元计数阈值进行比较,以确定相应的非非重叠单元的单元计数分类;进行分割方法,其基于具有相同的单元计数分类的连续非重叠单元将连续非重叠单元合并为合并段;将所述合并段的长度与长度阈值进行比较;
根据所述合并段的非重叠单元的单元计数参数或根据位于所述合并段的非重叠单元中的多个DNA分子的量来计算所述合并段的计数参数;将所述计数参数与一个或多个偏差阈值进行比较以确定计数分类;以及基于所述合并段的长度与所述长度阈值的比较和所述计数分类,确定所述胎儿在与所述合并段对应的亚染色体区域中是否具有所述畸变。5.计算机可读介质,其存储有多个指令,所述多个指令用于控制一个或多个处理器以通过分析来自怀有胎儿的雌性受试者的生物样本来识别胎儿的胎儿基因组中的亚染色体畸变的方法,所述生物样本包括来自所述雌性受试者和所述胎儿的无细胞DNA分子,所述畸变是缺失或扩增,所述方法包括:对于所述生物样本中的多个DNA分子中的每一个:测量所述DNA分子的尺寸;识别所述DNA分子在参考基因组中的位置;利用计算机系统通过以下检测所述生物样本中的第一亚染色体区域的畸变:确定位于所述第一亚染色体区域中的DNA分子的标准化量;以及将所述标...

【专利技术属性】
技术研发人员:卢煜明赵慧君陈君赐江培勇余烁妍
申请(专利权)人:香港中文大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1