使用多态计数来解析基因组分数制造技术

技术编号:10051287 阅读:158 留言:1更新日期:2014-05-15 22:38
公开一种从多态性例如小碱基变化或者插入-缺失可靠估计基因组分数(例如,胎儿分数)的方法。来自多基因组源的已测序数据用于确定对于一个或多个多态性等位基因计数。对于一个或多个多态性,接合性是分配的,而基因组分数从接合性和等位基因计数确定。某些实施例使用SNP作为相关多态性。所公开的方法能够应用作为目标在于已知多态性的故意的、预先设计的重测序研究的组成部分,或者能够用在从母体血浆产生的重叠序列中巧合发现的变化的回顾性分析中(或者其他任何存在多人DNA的混合物的设定)。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】公开一种从多态性例如小碱基变化或者插入-缺失可靠估计基因组分数(例如,胎儿分数)的方法。来自多基因组源的已测序数据用于确定对于一个或多个多态性等位基因计数。对于一个或多个多态性,接合性是分配的,而基因组分数从接合性和等位基因计数确定。某些实施例使用SNP作为相关多态性。所公开的方法能够应用作为目标在于已知多态性的故意的、预先设计的重测序研究的组成部分,或者能够用在从母体血浆产生的重叠序列中巧合发现的变化的回顾性分析中(或者其他任何存在多人DNA的混合物的设定)。【专利说明】使用多态计数来解析基因组分数相关申请的交叉引用本申请要求2011年4月12日提交的美国临时申请序号61/474362的优先权,通过引用将其内容完整地结合到本文中用于所有目的。
技术介绍
母体血液中的自由浮动胎儿DNA (有时称作“游离(cell free) DNA”或“cfDNA”)发现允许从血液样本来检测染色体异常、异倍性和畸变的可能性。母体血浆中的胎儿DNA的分数(fraction)丰度不是恒定的,而且随多种因素-包括样本处理和孕龄_而变化。在使用DNA测序来识别染色体畸变或遗传缺陷时,重要的是了解DNA总群体中的胎儿DNA的相对丰度。例如,当胎儿分数已知时,能够通过置换方法或者线性组合的积分或经由从a到无穷大的非中心F分布的卷积来计算统计能力(识别反常情况的概率,或者灵敏度),其中在零假设下的得分群体的重要性(错误地称作反常的最大似然)的a临界点没有畸变。用于检测胎儿分数的现有方法的缺点在于,它们依靠性染色体(其只能用于可靠地测量男性胚胎DNA的相对丰度)的丰度的量度或者已知为在怀孕与胚胎组织之间差异表达的基因的mRNA序列(其因孕龄或其它因素而须经表达的可变性)。胎儿分数的估计因若干讨厌因素而较难,包括:双亲种族差异群体遗传参数和测序误差。因此,需要在这些及其它普遍发生的混合因素存在的情况下具有健壮的方法。
技术实现思路
某些所公开实施例涉及通过对母体血液样本进行测序来可靠地测量胎儿自由浮动DNA的相对丰度的计算方法。在具体实施例中,本专利技术提供从多态性(例如小碱基变化或者插入-缺失,其相对双亲种族、胚胎性别、孕龄和其它环境因素是健壮的)来可靠地估计胎儿分数的方法。本文所公开的许多示例采用SNP作为相干多态性。本专利技术能够作为针对已知多态性的特意预先设计的再测序研究的组成部分来应用,或者能够用于通过从母体血浆(或者其中存在来自数人的DNA的混合的任何其它设定)所生成的重叠序列的一致性所发现的变化的回顾分析中。本文档提供用于估计母体血液样本中的胎儿DNA的分数丰度的技术。某些所公开技术使用通过偶然发现或者在设计用于便于估计胎儿分数的预先知道SNP的面板中发现的SNP的所观测等位基因频率。虽然公开的许多部分涉及估计样本中的胎儿核酸的分数,但是本专利技术并不局限于此。本文所述的技术和装置在许多情况下能够用于从两个基因组的混合中的一个基因组-其可以或者可以不是作为父 子基因组来相关的-来估计核酸的分数。本公开的某些方面涉及估计从怀孕个体的体液所得到的DNA中的胎儿DNA的分数。这类方法的特征可在于下列操作:(a)接收体液的样本;(b)在提取体液中存在的母体基因组和胎儿基因组的DNA的条件下从样本中提取DNA ; (c)在产生包含一个或多个多态性的DNA段序列的条件下采用核酸测序器对所提取DNA进行测序;(d)将从对液体中的DNA进行测序所得出的DNA段序列映射到参考序列上的一个或多个所指定多态性;(e)对于所指定多态性的至少一个来确定映射DNA段序列的等位基因频率;(f)基于怀孕个体的接合性和胎儿的接合性的组合来分类至少一个所指定多态性;以及(g)使用在(e)所确定的等位基因频率和来自(f)的接合性的组合来估计从怀孕个体所得到的DNA中的胎儿DNA的分数。映射可使用计算装置来执行,其编程为将核酸序列映射到一个或多个所指定多态性。一般来说,操作(d)-(g)的任一个可在程序指令下在一个或多个处理器上执行。在某些实施例中,从怀孕个体的体液所得到的DNA是从怀孕个体的血浆所得到的游离DNA。通常在没有选择性地放大一个或多个所指定多态性的任一个的情况下进行测序。在某些实施例中,映射从携带胎儿的个体的血液所得到的DNA段包括以计算方式将段映射到多态性的数据库。在某些实施例中,(f)中的分类将至少一个所指定多态性分为下列组合之一:(i)怀孕个体是纯合(homozygous)的,并且胎儿是纯合的,(ii)怀孕个体是纯合的,而胎儿是杂合(heterozygous)的,(iii)怀孕个体是杂合的,而胎儿是纯合的,以及(iv)怀孕个体是杂合的,并且胎儿是杂合的。可采用各种过滤操作。这些包括例如不予考虑组合(i)或组合(iv)中分类的任何多态性。在另一个示例中,方法还包括过滤至少一个所指定多态性,从而不予考虑具有比所定义阈值要大的未成年(minor)等位基因频率的任何多态性。在又一个示例中,方法包括如下操作:过滤至少一个所指定多态性,从而不予考虑具有比所定义阈值要小的未成年等位基因频率的任何多态性。分类操作可按照各种方式来实现。例如,它可涉及将阈值应用于(e)中确定的等位基因频率。在另一个示例中,分类操作涉及把来自(e)、对于多个多态性所得到的等位基因频率数据应用于混合模型。在一个实现中,混合模型采用阶乘矩。如本文所述所确定的胎儿分数可用于各种应用。在一些示例中,本文所述的方法包括如下操作:在一个或多个处理器上运行程序指令,以便将(g)中所确定的DNA的胎儿的分数自动记录在用于怀孕个体的患者病历中,其存储在计算机可读介质上。患者病历可由实验室、医生办公室、医院、保健组织、保险公司或者个人病历网站来保持。在另一个应用中,胎儿DNA的分数的估计用于规定、发起和/或`改变受检者(human subject)-从其获取母体测试样本——的治疗。在另一个应用中,胎儿DNA的分数的估计用于指示和/或执行一个或多个附加测试。本公开的另一方面涉及用于估计从怀孕个体的体液所得到的DNA中的胎儿DNA的分数的装置。这种装置的特征可在于下列特征:(a)测序器,配置成(i)接收从包含母体基因组和胎儿基因组的体液的样本所提取的DNA,并且(ii)在产生包含一个或多个所指定多态性的DNA段序列的条件下对所提取DNA进行测序;以及(b)计算装置,配置成(例如编程为)指示一个或多个处理器执行各种操作,例如随本文所述方法操作的两个或更多所述的那些操作。在一些实施例中,计算装置配置成:(i)将核酸序列映射到参考序列上的一个或多个所指定多态性,(?)对于所指定多态性的至少一个来确定映射DNA段序列的等位基因频率,(iii)基于怀孕个体的接合性和胎儿的接合性的组合来分类至少一个所指定多态性,以及(iV)使用等位基因频率和接合性的组合来估计从怀孕个体所得到的DNA中的胎儿DNA的分数。在某些实施例中,该装置还包括用于在提取母体基因组和胎儿基因组的DNA的条件下从样本中提取DNA的工具。在一些实施方式中,该装置包括配置成提取从怀孕个体的血浆所得到的游离DNA以供测序器中测序的模块。在一些示例中,该装置包括多态性的数据库。该计算装置还可配置成指示一个或多个处理器通过在计算上将段映射到多本文档来自技高网
...

【技术保护点】
一种估计在从怀孕个体的体液中获取的DNA中的胎儿DNA分数的方法,所述方法包括:(a)接收体液样本;(b)在提取体液中存在的母体基因组和胎儿基因组两者的DNA的条件下从样本中提取DNA;(c)在生成包含一个或多个多态性的DNA段序列的条件下利用核算测序器测序已提取DNA;(d)映射从测序体液中DNA得到的DNA段序列到参考序列上的一个或多个所指定多态性,其中映射利用计算装置执行,计算装置编程成映射核酸序列到一个或多个所指定多态性;(e)对至少一个所指定多态性确定所映射DNA段序列的等位基因频率;(f)基于怀孕个体的接合性和胎儿的接合性的组合分类至少一个所指定多态性;并且(g)利用(e)中确定的等位基因频率和来自(f)中的接合性的组合估计从怀孕个体获得的DNA中的胎儿DNA分数,其中(e)‑(g)在一个或多个处理器上执行,而该一个或多个处理器在用于确定、分类和估计的程序指令下运行。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:里查德·P·拉瓦布莱恩·K·利思约翰·P·伯克
申请(专利权)人:维里纳塔健康公司
类型:发明
国别省市:美国;US

网友询问留言 已有1条评论
  • 来自[美国加利福尼亚州圣克拉拉县山景市谷歌公司] 2014年12月08日 23:10
    分数表示一个数是另一个数的几分之几,或一个事件所有事件的比例把单位1平均分成若干份表示这样的一份或几份的数叫分数
    0
1