用于区分体细胞变异和种系变异的方法和系统技术方案

技术编号:24724517 阅读:78 留言:0更新日期:2020-07-01 00:48
在一方面中,鉴定来自核酸分子样品的核酸变异的体细胞来源或种系来源的方法,所述方法包括:确定针对核酸变异的定量测量,所述定量测量包括核酸变异的总等位基因计数和次要等位基因计数;鉴定核酸变异的相关变量;确定相关变量的定量值;生成针对核酸变异的基因组基因座处的预期种系突变等位基因计数的统计模型;至少部分地基于所述统计模型、定量值和至少一个定量测量来生成核酸变异的概率值(p值);以及将核酸变异(i)当p值低于预定阈值时分类为体细胞来源的,或(ii)当p值处于预定阈值或高于预定阈值时分类为种系来源的。

【技术实现步骤摘要】
【国外来华专利技术】用于区分体细胞变异和种系变异的方法和系统交叉引用本申请要求于2017年9月20日提交的美国临时申请第62/561,048号的权益,该申请通过引用以其整体并入本文。背景癌症基因组学的一个重要方面是精确鉴定基因改变的来源,以便对患者进行适当的治疗。最近的一项研究发现,超过2%的晚期癌症患者可能具有在针对可靶向的体细胞改变的下一代测序(NGS)期间偶然发现的未鉴定出的种系改变。然而,在不与正常组织比较的情况下,基于组织的NGS可能无法准确区分种系突变与体细胞突变。在血浆中,体细胞变异(variant)通常以可能比种系变异的突变等位基因分数(mutantallelefraction;MAF)低1-2个数量级的突变等位基因分数出现,并且因此液体活组织检查可以准确分配种系/体细胞来源。然而,某些因素诸如来自拷贝数变异(CNV)或杂合性丧失(lossofheterozygosity;LOH)的等位基因不平衡可以使种系MAF偏离种系MAF的预期范围。因此,存在对在确定变异来源时能够考虑到这些因素的方法的需求。概述本公开内容提供了用于区分核酸分子诸如无细胞脱氧核糖核酸(cfDNA)样品中的体细胞变异与种系变异的方法和系统。这样的方法可以使用常见单核苷酸多态性(SNP)对局部种系等位基因计数行为建模,并且可以基于MAF与观察到的种系MAF的偏差来区分体细胞变异。在一方面,本公开内容提供了鉴定来自核酸分子样品(例如,组织样品、无细胞DNA样品和/或类似样品)的核酸变异的体细胞来源或种系来源的方法。所述方法包括(a)确定针对来自核酸样品的核酸变异的一种或更多种定量测量。定量测量包括核酸变异的总等位基因计数和次要等位基因计数。所述方法还包括(b)鉴定来自核酸样品的核酸变异的至少一个相关变量,和(c)确定核酸变异的相关变量的定量值。所述方法还包括(d)产生针对核酸变异的基因组基因座处的预期种系突变等位基因计数的统计模型;和(e)基于针对预期种系等位基因计数的统计模型和核酸变异的相关变量的定量值以及针对核酸变异的至少一个定量测量,产生核酸变异的概率值(p值)。另外,所述方法还包括(f)将核酸变异(i)当核酸变异的p值低于阈值时分类为体细胞来源的,或(ii)当核酸变异的p值处于阈值或高于阈值时分类为种系来源的。在一方面,本公开内容提供了鉴定来自无细胞核酸分子(例如,无细胞脱氧核糖核酸(cfDNA)分子)样品的核酸变异的体细胞来源或种系来源的方法,所述方法包括:(a)确定针对来自无细胞核酸分子样品的核酸变异的多于一个定量测量,其中所述多于一个定量测量包括核酸变异的总等位基因计数和次要等位基因计数;(b)鉴定来自无细胞核酸分子样品的核酸变异的相关变量;(c)确定核酸变异的相关变量的定量值;(d)产生针对核酸变异的基因组基因座处的预期种系突变等位基因计数的统计模型;(e)至少部分地基于针对核酸变异的多于一个定量测量中的至少一个、针对预期种系突变等位基因计数的统计模型以及核酸变异的相关变量的定量值,产生核酸变异的概率值(p值);以及(f)将核酸变异(i)当核酸变异的p值低于预定阈值时分类为体细胞来源的,或(ii)当核酸变异的p值处于阈值或高于预定阈值时分类为种系来源的。在一些实施方案中,所述方法还包括从受试者获得无细胞核酸分子样品。在一些实施方案中,所述方法还包括接收从无细胞核酸分子样品产生的测序信息,其中测序信息包括包含核酸变异的无细胞核酸测序读段和核酸变异的相关变量,所述相关变量包括在涉及核酸变异的指定基因组区域内的至少一种杂合单核苷酸多态性(hetSNP)。在一些实施方案中,所述方法还包括对来自无细胞核酸分子样品的核酸进行测序以产生测序信息,其中针对核酸变异的多于一个定量测量和相关变量的定量值从测序信息来确定。在一些实施方案中,所述方法还包括确定针对核酸变异的多于一个定量测量,鉴定核酸变异的相关变量,以及根据从无细胞核酸分子样品产生的测序信息确定相关变量的定量值。在一些实施方案中,所述方法还包括使用无细胞核酸分子样品的核酸的预期种系突变等位基因计数的β-二项式模型来产生预定阈值。在一些实施方案中,所述方法还包括对来自无细胞核酸分子样品的多于一个基因组基因座的多于一个核酸变异的体细胞来源或种系来源进行分类。在一些实施方案中,核酸变异的相关变量包括至少一种杂合单核苷酸多态性(hetSNP)。在一些实施方案中,核酸变异的相关变量包括至少两种hetSNP。在一些实施方案中,核酸变异的相关变量包括与包含核酸变异的基因组基因座相连的基因组基因座。在一些实施方案中,所述方法还包括确定核酸变异的相关变量的一个或更多个突变等位基因计数的平均值和/或方差值。在一些实施方案中,所述方法还包括确定核酸变异的相关变量的平均定量值。在一些实施方案中,核酸变异的相关变量包括以下中的一项或更多项:杂合单核苷酸多态性(hetSNP)、GC含量测量、探针特异性偏倚测量、片段长度值、测序统计测量、拷贝数断点(breakpoint)以及受试者的临床数据。在一些实施方案中,所述方法还包括确定核酸变异的相关变量的平均值和/或方差值。在一些实施方案中,所述方法还包括确定核酸变异的局部种系折叠突变等位基因分数(MAF),μ箱,其中箱是包含核酸变异的基因或另一指定基因组区域,且折叠MAF是min(MAF,1-MAF)。在一些实施方案中,指定基因组区域是在核酸变异的约101个、102个、103个、104个、105个、106个、107个、108个、109个或1010个碱基对内的区域。在一些实施方案中,核酸变异的相关变量包括至少一种单核苷酸多态性(SNP),所述单核苷酸多态性(SNP)包含大于约0.001的群体等位基因频率(AF)。在一些实施方案中,核酸变异的相关变量包括至少一种非致癌性单核苷酸多态性(SNP)。在一些实施方案中,核酸变异的相关变量包括至少一种单核苷酸多态性(SNP),所述单核苷酸多态性(SNP)包含小于约0.9的突变等位基因分数(MAF)。在一些实施方案中,相关变量包括在涉及核酸变异的指定基因组区域内的至少一种杂合单核苷酸多态性(SNP),并且其中所述方法包括使用下式估计β二项式分布参数:(x,y)~β二项式(μ箱,ρ),其中y=至少一种种系杂合SNP的总分子计数的向量,对于每一种种系杂合SNP有一个条目;x=min(至少一种种系杂合SNP的突变等位基因计数,y-至少一种种系杂合SNP的突变等位基因计数)的向量,对于每一种种系杂合SNP有一个条目;μ箱=箱中杂合SNP的平均突变等位基因计数的估计值,其中箱是涉及核酸变异的指定基因组区域;以及ρ=分散度参数(dispersionparameter)的估计值。在一些实施方案中,所述方法还包括计算p值的上限和下限。在一些实施方案中,所述方法还包括使用下式计算核酸变异的双尾p值:p值=2*min(Prbb(x'>A|μ箱,ρ,B),Prbb(x'<A|μ箱,ρ,B)),其中Prbb=β二项式的概率;x'=以所述β二项式分布的随机变量;A=核酸变异的突变等位基因计数;以及B=核酸变异的总分子计数本文档来自技高网...

【技术保护点】
1.一种鉴定来自无细胞脱氧核糖核酸(cfDNA)分子样品的核酸变异的体细胞来源或种系来源的方法,所述方法包括:/n(a)确定针对来自所述cfDNA样品的所述核酸变异的多于一个定量测量,其中所述多于一个定量测量包括所述核酸变异的总等位基因计数和次要等位基因计数;/n(b)鉴定来自所述cfDNA分子样品的所述核酸变异的相关变量;/n(c)确定所述核酸变异的相关变量的定量值;/n(d)产生针对所述核酸变异的基因组基因座处的预期种系突变等位基因计数的统计模型;/n(e)至少部分地基于针对所述核酸变异的多于一个定量测量中的至少一个、针对预期种系突变等位基因计数的所述统计模型以及所述核酸变异的相关变量的定量值,产生所述核酸变异的概率值(p值);以及/n(f)将所述核酸变异(i)当所述核酸变异的p值低于预定阈值时分类为体细胞来源的,或(ii)当所述核酸变异的p值处于所述预定阈值或高于所述预定阈值时分类为种系来源的。/n

【技术特征摘要】
【国外来华专利技术】20170920 US 62/561,0481.一种鉴定来自无细胞脱氧核糖核酸(cfDNA)分子样品的核酸变异的体细胞来源或种系来源的方法,所述方法包括:
(a)确定针对来自所述cfDNA样品的所述核酸变异的多于一个定量测量,其中所述多于一个定量测量包括所述核酸变异的总等位基因计数和次要等位基因计数;
(b)鉴定来自所述cfDNA分子样品的所述核酸变异的相关变量;
(c)确定所述核酸变异的相关变量的定量值;
(d)产生针对所述核酸变异的基因组基因座处的预期种系突变等位基因计数的统计模型;
(e)至少部分地基于针对所述核酸变异的多于一个定量测量中的至少一个、针对预期种系突变等位基因计数的所述统计模型以及所述核酸变异的相关变量的定量值,产生所述核酸变异的概率值(p值);以及
(f)将所述核酸变异(i)当所述核酸变异的p值低于预定阈值时分类为体细胞来源的,或(ii)当所述核酸变异的p值处于所述预定阈值或高于所述预定阈值时分类为种系来源的。


2.如权利要求1所述的方法,所述方法还包括从受试者获得所述cfDNA分子样品。


3.如权利要求1或2所述的方法,所述方法还包括接收从所述cfDNA样品产生的测序信息,其中所述测序信息包括包含所述核酸变异的cfDNA测序读段和所述核酸变异的相关变量,所述相关变量包括在涉及所述核酸变异的指定基因组区域内的至少一种杂合单核苷酸多态性(hetSNP)。


4.如前述权利要求中任一项所述的方法,所述方法还包括对来自所述cfDNA样品的核酸进行测序以产生测序信息,其中针对所述核酸变异的多于一个定量测量和相关变量的定量值从所述测序信息来确定。


5.如前述权利要求中任一项所述的方法,所述方法还包括确定针对所述核酸变异的多于一个定量测量,鉴定所述核酸变异的相关变量,以及根据从所述cfDNA分子样品产生的测序信息确定所述相关变量的定量值。


6.如前述权利要求中任一项所述的方法,所述方法还包括使用所述cfDNA分子样品的核酸的预期种系突变等位基因计数的β-二项式模型来产生所述预定阈值。


7.如前述权利要求中任一项所述的方法,所述方法还包括对来自所述cfDNA分子样品的多于一个基因组基因座的多于一个核酸变异的体细胞来源或种系来源进行分类。


8.如前述权利要求中任一项所述的方法,其中所述核酸变异的相关变量包括至少一种杂合单核苷酸多态性(hetSNP)。


9.如权利要求8所述的方法,其中所述核酸变异的相关变量包括至少两种hetSNP。


10.如前述权利要求中任一项所述的方法,其中所述核酸变异的相关变量包括与包含所述核酸变异的基因组基因座相连的基因组基因座。


11.如前述权利要求中任一项所述的方法,所述方法还包括确定所述核酸变异的相关变量的一个或更多个突变等位基因计数的平均值和/或方差值。


12.如前述权利要求中任一项所述的方法,所述方法还包括确定所述核酸变异的相关变量的平均定量值。


13.如前述权利要求中任一项所述的方法,其中所述核酸变异的相关变量包括以下中的一项或更多项:杂合单核苷酸多态性(hetSNP)、GC含量测量、探针特异性偏倚测量、片段长度值、测序统计测量、拷贝数断点以及受试者的临床数据。


14.如前述权利要求中任一项所述的方法,所述方法还包括确定所述核酸变异的相关变量的平均值和/或方差值。


15.如前述权利要求中任一项所述的方法,所述方法还包括确定所述核酸变异的局部种系折叠突变等位基因分数(MAF),μ箱,其中箱是包含所述核酸变异的基因或另一指定基因组区域,且折叠MAF是min(MAF,1-MAF)。


16.如权利要求15所述的方法,其中所述指定基因组区域是在所述核酸变异的约101个、102个、103个、104个、105个、106个、107个、108个、109个或1010个碱基对内的区域。


17.如前述权利要求中任一项所述的方法,其中所述核酸变异的相关变量包括至少一种单核苷酸多态性(SNP),所述单核苷酸多态性(SNP)包含大于约0.001的群体等位基因频率(AF)。


18.如前述权利要求中任一项所述的方法,其中所述核酸变异的相关变量包括至少一种非致癌性单核苷酸多态性(SNP)。


19.如前述权利要求中任一项所述的方法,其中所述核酸变异的相关变量包括至少一种单核苷酸多态性(SNP),所述单核苷酸多态性(SNP)包含小于约0.9的突变等位基因分数(MAF)。


20.如前述权利要求中任一项所述的方法,其中所述相关变量包括在涉及所述核酸变异的指定基因组区域内的至少一种杂合单核苷酸多态性(SNP),并且其中所述方法还包括使用下式估计β二项式分布参数:
(x,y)~β二项式(μ箱,ρ),
其中
y=种系杂合SNP的总分子计数的向量,对于在(b)中鉴定出的每一种种系杂合SNP有一个条目;
x=min(种系杂合SNP的突变等位基因计数,y-种系杂合SNP的突变等位基因计数)的向量,对于在(b)中鉴定出的每一种种系杂合SNP有一个条目;
μ箱=箱中杂合SNP的平均突变等位基因计数的估计值,其中所述箱是涉及所述核酸变异的指定基因组区域;以及
ρ=分散度参数的估计值。


21.如权利要求20所述的方法,所述方法还包括使用下式计算所述核酸变异的双尾p值:
p值=2*min(Prbb(x'>A|μ箱,ρ,B),Prbb(x'<A|μ箱,ρ,B)),
其中
Prbb=β二项式的概率;
x'=以所述β二项式分布的随机变量;
A=所述核酸变异的突变等位基因计数;以及
B=所述核酸变异的总分子计数。


22.如权利要求20所述的方法,其中ρ包括来自历史样品集的至少一组ρ值的中值。


23.如权利要求22所述的方法,所述方法还包括用核酸变异的GC含量的函数代替中值ρ参数。


24.如权利要求20所述的方法,所述方法还包括确定μ箱的最大似然估计值。


25.如权利要求20所述的方法,所述方法还包括确定μ箱的平均估计值。


26.如权利要求20所述的方法,所述方法还包括确定ρ的最大似然估计值。


27.如权利要求20所述的方法,所述方法还包括确定ρ的方差估计值。


28.如前述权利要求中任一项所述的方法,所述方法还包括计算所述p值的上限和下限。


29.一种非瞬时性计算机可读介质,所述非瞬时性计算机可读介质包含计算机可执行指令,所述计算机可执行指令当被至少一个电子处理器执行时执行包括以下步骤的方法:
(a)根据从无细胞脱氧核糖核酸(cfDNA)样品产生的测序信息确定针对核酸变异的多于一个定量测量,其中所述多于一个定量测量包括所述核酸变异的总等位基因计数和次要等位基因计数;
(b)从所述测序信息鉴定所述核酸变异的相关变量;
(c)确定所述核酸变异的相关变量的定量值;
(d)产生针对所述核酸变异的基因组基因座处的预期种系突变等位基因计数的统计模型;
(e)至少部分地基于针对所述核酸变异的多于一个定量测量中的至少一个、针对预期种系突变等位基因计数的所述统计模型以及所述核酸变异的相关变量的定量值,产生所述核酸变异的概率值(p值);以及
(f)将所述核酸变异(i)当所述核酸变异的p值低于预定阈值时分类为体细胞来源的,或(ii)当所述核酸变异的p值处于所述预定阈值或高于所述预定阈值时分类为种系来源的。


30.如权利要求29所述的非瞬时性计算机可读介质,其中所述预定阈值使用所述cfDNA样品的核酸的预期种系突变等位基因计数的β-二项式模型来产生。


31.如权利要求29至30中任一项所述的非瞬时性计算机可读介质,其中所述核酸变异的相关变量包括至少一种杂合单核苷酸多态性(hetSNP)。


32.如权利要求31所述的非瞬时性计算机可读介质,其中所述核酸变异的相关变量包括至少两种hetSNP。


33.如权利要求29至32中任一项所述的非瞬时性计算机可读介质,其中所述核酸变异的相关变量包括与包含所述核酸变异的基因组基因座相连的基因组基因座。


34.如权利要求29至33中任一项所述的非瞬时性计算机可读介质,其中所述核酸变异的相关变量的一个或更多个突变等位基因计数的平均值和/或方差值被确定。


35.如权利要求29至34中任一项所述的非瞬时性计算机可读介质,其中所述多于一个定量测量中的至少一个包括所述cfDNA样品的包含所述核酸变异的核酸分子的数目。


36.如权利要求29至35中任一项所述的非瞬时性计算机可读介质,其中所述核酸变异的相关变量包括以下中的一项或更多项:杂合单核苷酸多态性(hetSNP)、GC含量测量、探针特异性偏倚测量、片段长度值、测序统计测量、拷贝数断点以及受试者的临床数据。


37.如权利要求29至36中任一项所述的非瞬时性计算机可读介质,其中所述核酸变异的局部种系折叠突变等位基因分数(MAF),μ箱被确定,其中箱是包含所述核酸变异的基因或另一指定基因组区域,且折叠MAF是min(MAF,1-MAF)。


38.如权利要求37所述的非瞬时性计算机可读介质,其中所述指定基因组区域是在所述核酸变异的约101个、102个、103个、104个、105个、106个、107个、108个、109个或1010个碱基对内的区域。


39.如权利要求29至38中任一项所述的非瞬时性计算机可读介质,其中所述核酸变异的相关变量包括至少一种单核苷酸多态性(SNP),所述单核苷酸多态性(SNP)包含大于约0.001的群体等位基因频率(AF)。


40.如权利要求29至39中任一项所述的非瞬时性计算机可读介质,其中所述相关变量包括至少一种非致癌性单核苷酸多态性(SNP)。


41.如权利要求29至40中任一项所述的非瞬时性计算机可读介质,其中所述核酸变异的相关变量包括至少一种单核苷酸多态性(SNP),所述单核苷酸多态性(SNP)包含小于约0.9的突变等位基因分数(MAF)。


42.如权利要求29至41中任一项所述的非瞬时性计算机可读介质,其中所述相关变量包括在涉及所述核酸变异的指定基因组区域内的至少一种杂合单核苷酸多态性(SNP),并且其中β二项式分布参数使用下式估计:
(x,y)~β二项式(μ箱,ρ),
其中
y=种系杂合SNP的总分子计数的向量,对于在(b)中鉴定出的每一种种系杂合SNP有一个条目;
x=min(种系杂合SNP的突变等位基因计数,y-种系杂合SNP的突变等位基因计数)的向量,对于在(b)中鉴定出的每一种种系杂合SNP有一个条目;
μ箱=箱中杂合SNP的突变等位基因计数的估计值,其中所述箱是涉及所述核酸变异的指定基因组区域;以及
ρ=分散度参数的估计值。


43.如权利要求29至42中任一项所述的非瞬时性计算机可读介质,其中所述p值的上限和下限被计算。


44.如权利要求43所述的非瞬时性计算机可读介质,其中所述核酸变异的双尾p值使用下式计算:
p值=2*min(Prbb(x'>x|μ箱,ρ,B),Prbb(x'<x|μ箱,ρ,B)),
其中
Prbb=β二项式的概率;
x'=以所述β二项式分布的随机变量;
A=所述核酸变异的突变等位基因计数;以及
B=所述核酸变异的总分子计数。


45.一种系统,所述系统包括控制器,所述控制器包含非瞬时性计算机可读介质或能够访问所述非瞬时性计算机可读介质,所述非瞬时性计算机可读介质包含计算机可执行指令,所述计算机可执行指令当被至少一个电子处理器执行时执行包括以下步骤的方法:
(a)根据从无细胞脱氧核糖核酸(cfDNA)样品产生的测序信息确定针对核酸变异的多于一个定量测量,其中所述多于一个定量测量包括所述核酸变异的总等位基因计数和次要等位基因计数;
(b)从所述测序信息鉴定所述核酸变异的相关变量;
(c)确定所述核酸变异的相关变量的定量值;
(d...

【专利技术属性】
技术研发人员:特蕾西·南斯埃琳娜·赫尔曼达里娅·丘多瓦
申请(专利权)人:夸登特健康公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1