通过母亲血浆DNA的浅深度测序准确定量胎儿DNA分数制造技术

技术编号:17954736 阅读:39 留言:0更新日期:2018-05-16 03:26
本发明专利技术的实施例提供用于在不使用父亲或胎儿基因型的情况下推断母亲血浆中的胎儿DNA分数的方法、系统和装置。母亲基因型信息可以从仅有母亲DNA的样品获得,或者可以根据对兼有母亲和胎儿DNA分子的生物样品的浅深度测序而假定。因为测序可处于浅深度,所以即使存在非母亲等位基因,基因座可以仅有很少的读取,并且可以无法显示非母亲等位基因。然而,表征经测序的非母亲等位基因的归一化参数可用于提供对胎儿DNA分数的精确估计,即使非母亲等位基因的量是错误的。本文所述的方法可不需要对特定区域进行高深度测序或富集。因此,这些方法可以纳入到广泛使用的无创产前检测和其它诊断中。

Accurate quantification of fetal DNA scores through maternal plasma DNA sequencing in shallow depth

Embodiments of the invention provide methods, systems and devices for inferring fetal DNA fraction in maternal plasma without using paternal or fetal genotypes. The mother genotype information can be obtained from the only sample of the mother's DNA, or may be based on the shallow sequencing of the biological samples with both mother and fetal DNA molecules. Because the sequencing can be in a shallow depth, even if the non mother allele exists, the loci can only be read only a little, and the non mother allele can not be displayed. However, the normalized parameter that characterizing the sequence of non mother alleles can be used to provide accurate estimation of the fetal DNA fraction, even if the amount of non mother alleles is wrong. The method described in this paper does not require deep sequencing or enrichment of specific regions. Therefore, these methods can be incorporated into widely used non-invasive prenatal diagnosis and other diagnoses.

【技术实现步骤摘要】
【国外来华专利技术】通过母亲血浆DNA的浅深度测序准确定量胎儿DNA分数相关申请的交叉引用本申请要求2015年9月22日提交的美国申请62/222,157的优先权,其内容通过引用并入本文用于所有目的。
技术介绍
母亲血浆中的循环游离胎儿DNA的发现[LoYM(Thediscoveryofcirculatingcell-freefetalDNAinmaternalplasma)等人(1997),Lancet,350:485-487]催化了一系列无创产前诊断的新途径,包括胎儿RhD血型基因分型[LoYM等人(1998),新英格兰医学杂志(NEnglJMed),339:1734-1738,FinningK等人(2008),英国医学杂志(BMJ),336:816-818]、用于伴性障碍的胎儿性别鉴定(fetalsexdeterminationforsex-linkeddisorders)[CostaJM,BenachiA,GautierE(2002),新英格兰医学杂志(NEnglJMed),346:1502]、染色体非整倍性检测[LoYM等人(2007),美国科学院院报(ProcNatlAcadSciUSA.)104:13116-13121;ChiuRW等人(2008),美国科学院院报(ProcNatlAcadSciUSA.)105:20458-20463;ChiuRW,CantorCR,LoYM(2009),遗传学进展(TrendsGenet),25:324-331;FanHC等人(2008),美国科学院院报(ProcNatlAcadSciUSA.),105:16266-16271;ChiuRW等人(2011),英国医学杂志(BMJ)342:c7401;YuSC等人(2014),美国科学院院报(ProcNatlAcadSciUSA),111:8583-8588],以及单基因疾病的检测[LoYMD等人(2010),科学转化医学(SciTranslMed),2:61ra91;LamKW等人(2012),临床化学(ClinChem.);NewMI等人(2014),临床内分泌学与代谢杂志(TheJournalofClinicalEndocrinology&Metabolism),99:E1022-E1030;YooS-K等人(2015),临床化学(ClinicalChemistry);MaD等人(2014),基因(Gene),544:252-258;TsuiN等人(2011),血液(Blood),117:3684-3691]。在前述的应用中,胎儿DNA分数(也称为分数胎儿DNA浓度或胎儿DNA百分比)的准确扣除对于通过使用血浆DNA的无创产前诊断的结果的准确统计解释是重要的,特别是在取决于这个参数的统计模型用于检测染色体非整倍性的情况下[SparksAB等人,(2012),美国妇产科杂志(AmJObstetGynecol),206:319e311-319]以及鉴定单基因疾病遗传的情况下[LoYM等人(2007),美国科学院院报(ProcNatlAcadSciUSA.)104:13116-13121;LoYMD等人(2010),科学转化医学(SciTranslMed),2:61ra91;LamKW等人(2012),临床化学(ClinChem.);NewMI等人(2014),临床内分泌学与代谢杂志(TheJournalofClinicalEndocrinology&Metabolism),99:E1022-E1030;YooS-K等人(2015),临床化学(ClinicalChemistry);TsuiNB等人(2011),血液(Blood),117:3684-3691]。例如,胎儿DNA分数是用于准确确定哪种母亲单倍型传送给胎儿的相对单倍型剂量分析(RHDO)的中心参数[LoYMD等人(2010),科学转化医学(SciTranslMed),2:61ra91;LamKW等人(2012),临床化学(ClinChem.);NewMI等人(2014),临床内分泌学与代谢杂志(TheJournalofClinicalEndocrinology&Metabolism),99:E1022-E1030]。在该诊断方法中,基本原理是传送给胎儿的母亲单倍型的相对剂量会比未传送者稍微过表现以及胎儿DNA分数用于确定过表现的统计显著性。迄今为止,已经开发了许多方法来估计孕妇的母亲血浆中分数胎儿DNA浓度。例如,来源于Y染色体的特异性信号用以推断携带男性胎儿的孕妇中的胎儿DNA分数[ChiuRW等人(2011),英国医学杂志(BMJ)342:c7401;LoYM等人(1998),美国人类遗传学杂志(AmJHumGenet),62:768-775;LunFM等人(2008),临床化学(ClinChem)54:1664-1672;HudecovaI等人(2014),公共科学图书馆期刊(PlosOne),9:e88484]。然而,基于Y染色体特异性信号的方法不适用于怀有女性胎儿的孕妇。另一种方法是使用单核苷酸多态性(SNP),使得计算胎儿特异性等位基因与共有等位基因的比率以推断胎儿DNA分数。在这种方法中,基因型信息必须是已知的,并且应该符合以下情况中的一种:(a)母亲是纯合的而胎儿是杂合的;(b)父亲和母亲基因型都是纯合的,但具有不同的等位基因[LoYMD等人(2010),科学转化医学(SciTranslMed),2:61ra91;LiaoGJ等人(2011),临床化学(ClinChem),57:92-101]。但是,一方面,在无创产前诊断的实际临床情形中,胎儿基因型不可事先获得。另一方面,父亲差异的发生率可高达30%,这通过世界各地对父亲差异的流行病学研究得出[BellisMA,HughesK,HughesS,AshtonJR(2005)流行病学与社区卫生杂志(JEpidemiolCommunityHealth),59:749-754],这限制了用于数据分析的父亲DNA的可用性。即使通过利用跨越不同SNP位点的母亲血浆DNA的高深度测序(例如母亲血浆DNA的靶向测序)开发独立于亲本基因型的算法以避免额外基因型信息的先决条件[JiangP等人(2012),生物信息学(Bioinformatics),28:2883-2890],也需要额外的努力来捕获一组感兴趣的区域,例如,通过使用基于杂交或基于扩增子的富集系统[SparksAB等人,(2012),美国妇产科杂志(AmJObstetGynecol),206:319e311-319;LiaoGJ等人(2011),临床化学(ClinChem),57:92-101]。除了取决于SNP的方法外,还在探索不取决于SNP的方法。例如,母亲血浆DNA的片段尺寸可以用于估计胎儿DNA分数[YuSC等人(2014),美国科学院院报(ProcNatlAcadSciUSA),111:8583-8588;KimSK等人(2015),产前诊断(Prenataldiagnosis):n/a-n/a],因为源自胎儿的DNA通常比母源DNA更短[LoYMD等人(2010),科学转化医学(SciTranslMed),本文档来自技高网...
通过母亲血浆DNA的浅深度测序准确定量胎儿DNA分数

【技术保护点】
测量怀有胎儿的女性的生物样品中胎儿DNA分数的方法,所述生物样品包括母亲DNA分子和胎儿DNA分子,所述方法包括通过计算机系统执行以下步骤:基于序列信息鉴定多个位点,所述序列信息表明所述女性就所述多个位点的每个位点处的第一等位基因而言是纯合的;由所述生物样品的DNA分子获得多个读取;鉴定所述多个读取在参照基因组中的位置;基于所述多个读取确定第一组DNA分子的第一值,其中:所述第一组DNA分子中的每个DNA分子包括位于所述多个位点的位点处的读取,并且在所述位点处显示与所述第一等位基因不同的第二等位基因,以及所述第一值定义所述第一组DNA分子的特性;确定第二组DNA分子的第二值,其中:所述第二组DNA分子中的每个DNA分子包括位于所述多个位点的位点处的读取,并在所述位点处显示所述第一等位基因,以及所述第二值定义所述第二组DNA分子的特性;由所述第一值和所述第二值确定参数的参数值;将所述参数值与使用具有已知胎儿DNA分数的至少一个其它样品确定的校准点和对应于所述至少一个其它样品中的所述参数的单独测量值的校准值进行比较;以及基于所述比较计算所述胎儿DNA分数。

【技术特征摘要】
【国外来华专利技术】2015.09.22 US 62/222,1571.测量怀有胎儿的女性的生物样品中胎儿DNA分数的方法,所述生物样品包括母亲DNA分子和胎儿DNA分子,所述方法包括通过计算机系统执行以下步骤:基于序列信息鉴定多个位点,所述序列信息表明所述女性就所述多个位点的每个位点处的第一等位基因而言是纯合的;由所述生物样品的DNA分子获得多个读取;鉴定所述多个读取在参照基因组中的位置;基于所述多个读取确定第一组DNA分子的第一值,其中:所述第一组DNA分子中的每个DNA分子包括位于所述多个位点的位点处的读取,并且在所述位点处显示与所述第一等位基因不同的第二等位基因,以及所述第一值定义所述第一组DNA分子的特性;确定第二组DNA分子的第二值,其中:所述第二组DNA分子中的每个DNA分子包括位于所述多个位点的位点处的读取,并在所述位点处显示所述第一等位基因,以及所述第二值定义所述第二组DNA分子的特性;由所述第一值和所述第二值确定参数的参数值;将所述参数值与使用具有已知胎儿DNA分数的至少一个其它样品确定的校准点和对应于所述至少一个其它样品中的所述参数的单独测量值的校准值进行比较;以及基于所述比较计算所述胎儿DNA分数。2.根据权利要求1所述的方法,其中:所述第一值是位于所述多个位点并具有所述第二等位基因的读取的第一数目,所述第二值是位于所述多个位点并具有所述第一等位基因的读取的第二数目,以及所述参数是非母亲等位基因分数。3.根据权利要求1所述的方法,其中确定所述第一值和所述第二值还包括:测量所述第一组DNA分子和所述第二组DNA分子的尺寸,其中所述第一值是所述第一组DNA分子的第一尺寸分布的第一尺寸值,并且其中所述第二值是所述第二组DNA分子的第二尺寸分布的第二尺寸值。4.测量怀有胎儿的女性的生物样品中胎儿DNA分数的方法,所述生物样品包括母亲DNA分子和胎儿DNA分子,所述方法包括通过计算机系统执行以下步骤:基于序列信息鉴定多个位点,所述序列信息表明所述女性就所述多个位点的每个位点处的第一等位基因而言是纯合的;由所述生物样品的DNA分子获得多个读取;鉴定所述多个读取在参照基因组中的位置;确定读取的第一量,其中:所述第一量的读取中的每个读取位于所述多个位点的位点处,以及每个读取在所述位点处显示不同于所述第一等位基因的第二等位基因;确定所述多个位点处的读取的第二量,其中:所述第二量的读取中的每个读取位于所述多个位点的位点处,以及每个读取在所述位点处显示所述第一等位基因;由所述第一量和所述第二量确定非母亲等位基因分数;得到校准点,所述校准点使用具有已知胎儿DNA分数和实测非母亲等位基因分数的另一个样品确定;以及使用所述校准点和所述非母亲等位基因分数计算所述胎儿DNA分数。5.根据权利要求4所述的方法,其中:所述校准点是多个校准点中的一个校准点,以及所述多个校准点构成校准曲线,所述方法还包括:通过以下步骤计算所述校准曲线:确定来自多个孕妇的多个其它样品的胎儿DNA分数;计算所述多个样品的非母亲等位基因分数;以及将所述胎儿DNA分数和所述非母亲等位基因分数拟合到线性函数,其中所述线性函数描述所述校准曲线。6.根据权利要求4所述的方法,其中确定所述多个位点处的读取的所述第二量包括确定所述多个读取的读取总数,其中所述多个读取的所述读取总数是所述读取的第二量。7.测量怀有胎儿的女性的生物样品中胎儿DNA分数的方法,所述生物样品包括母亲DNA分子和胎儿DNA分子,所述方法包括通过计算机系统执行以下步骤:基于序列信息鉴定多个位点,所述序列信息表示所述女性就所述多个位点的每个位点处的第一等位基因而言是纯合的;由所述生物样品的DNA分子获得多个读取;鉴定所述多个读取在参照基因组中的位置;确定所述生物样品的DNA分子的尺寸;确定第一组DNA分子的第一尺寸值,其中:所述第一组DNA分子中的每个DNA分子包括位于所述多个位点的位点处的读取,并且在所述位点处显示与所述第一等位基因不同的第二等位基因,以及所述第一尺寸值对应于所述第一组DNA分子的第一尺寸分布的统计值;确定所述第二组DNA分子的第二尺寸值,其中:所述第二组DNA分子中的每个DNA分子包括位于所述多个位点的位点处的读取,并在所述位点处显示所述第一等位基因,以及所述第二尺寸值对应于所述第二组DNA分子的第二尺寸分布的统计值;由所述第一尺寸值和所述第二尺寸值确定参数值;将所述参数值与使用具有已知胎儿DNA分数的至少一个其它样品确定的校准点和对应于所述至少一个其它样品的所述参数的单独测量值的校准值进行比较;以及基于所述比较计算所述胎儿DNA分数。8.根据权利要求7所述的方法,其中:所述第一尺寸值是在所述第一组DNA分子中具有最大尺寸的DNA分子的第一累积频率,以及所述第二尺寸值是在所述第二组DNA分子中具有所述最大尺寸的DNA分子的第二累积频率。9.根据权利要求7所述的方法,其中:所述第一尺寸值是所述第一组DNA分子的中值尺寸、平均值尺寸或模式,以及所述第二尺寸值是所述第二组DNA分子的中值尺寸、平均值尺寸或模式。10.根据权利要求7所述的方法,其中:所述校准点是多个校准点中的一个校准点,以及所述多个校准点构成校准曲线,所述方法还包括:通过以下步骤计算所述校准曲线:确定来自多个孕妇的多个其它样品的胎儿DNA分数;计算所述多个样品的参数值;以及将所述胎儿DNA分数和所述非母亲等位基因分数拟合到线性函数,其中所述线性函数描述所述校准曲线。11.根据权利要求5或10所述的方法,其中确定所述多个其它样品中的每个其它样品的所述胎儿DNA分数包括:鉴定第二多个位点,其中在所述第二多个位点中的每个位点处,所述多个孕妇中的孕妇是纯合的并且所述孕妇的所述胎儿是杂合的;由所述其它样品的DNA分子获得多个读取;确定在所述第二多个位点处显示胎儿特异性等位基因的读取的第三量;确定在所述第二多个位点处显示共有等位基因的读取的第四量;以及使用所述第三量和所述第四量确定所述胎儿DNA分数。12.根据权利要求1、4或7所述的方法,其中:所述多个读取是第一多个读取,所述生物样品是第一生物样品,鉴定所述多个位点包括由来自第二生物样品的DNA分子的第二多个读取鉴定所述多个位点,以及所述第二生物样品不包含胎儿DNA分子。13.根据权利要求1、4或7所述的方法,其中:所述多个位点是第一多个位点,所述多个读取限于来自第二多个位点的读取,其中所述第二多个位点是在数据库中被鉴定为对应于双等位基因位点的位点。14.根据权利要求1、4或7所述的方法,其中所述第二等位基因限于在数据库中被鉴定为对应于双等位基因位点的等位基因。15.根据权利要求1、4或7所述的方法,其中鉴定所述多个位点包括对来自所述女性的细胞样品进行基因分型。16.根据权利要求1、4或7所述的方法,其中:所述多个读取是第一多个读取,所述生物样品是第一生物样品,以及鉴定所述多个位点包括由不同于所述第一生物样品的第二生物样品的DNA分子获得第二多个读取。17.根据权利要求1、4或7所述的方法,其中:所述多个读取是第一多个读取,以及鉴定所述多个位点包括由所述生物样品的DNA分子获得第二多个读取。18.根据权利要求1、4或7所述的方法,其中:所述多个位点是第一多个位点,以及所述方法还包括:由参照数据库提供第二多个位点,其中:所述第二多个位点包含具有已知单核苷酸多态性的位点,以及所述第一多个位点中的每一个是所述第二多个位点中的一个。19.根据权利要求1、4或7所述的方法,其还包括:接收所述生物样品;以及对所述生物样品中的多个DNA分子进行测序以获得读取。20.根据权利要求1、4或7所述的方法,其还包括:接收所述生物样品;以及使用探针微阵列分析所述生物样品中的多个DNA分子以获得读取。21.根据权利要求1、4或7所述的方法,其中所述多个读取包含少于或等于5000万个读取。22.根据权利要求1、4或7所述的方法,其中所述多个读取等于或小于单倍体人类基因组的1x覆盖率。23.根据权利要求1、4或7所述的方法,其中所述多个位点的一部分位点不包含显示不同于所述第一等位基因的第二等位基因的读取。24.用于测量怀有胎儿的女性的生物样品中的胎儿DNA分数的方...

【专利技术属性】
技术研发人员:卢煜明江培勇陈君赐赵慧君
申请(专利权)人:香港中文大学
类型:发明
国别省市:中国香港,81

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1