【技术实现步骤摘要】
鉴定基因组中的变异的定相和连接方法本申请是基于申请日为2014年10月1日,优先权日为2013年10月1日,申请号为201480054553.3,专利技术名称为:“鉴定基因组中的变异的定相和连接方法”的专利申请的分案申请。对相关申请的交叉引用本申请要求2013年10月1日提交的美国临时申请号61/885,470,标题为“PHASINGANDLINKINGPROCESSESTOIDENTIFYVARIATIONSINAGENOME”的优先权,并是该申请的非临时申请,通过提述将其整体内容并入本文用于所有目的。本申请涉及共同拥有的美国专利申请号13/448,279,标题为“SequencingSmallAmountsOfComplexNucleicAcids”(代理人案号92171-5039US),提交于2012年4月16日;美国专利申请号13/447,087,标题为“ProcessingAndAnalysisOfComplexNucleicAcidSequenceData”(代理人案号92171-5041US),提交于2012年4月13日;美国专利申请号13/649,966,标题为“IdentificationOfDNAFragmentsAndStructuralVariations”(代理人案号92171-002510US),提交于2012年10月11日;美国专利申请号13/591,723,标题为“PhasingOfHeterozygousLociToDetermineGenomicHaplotypes”(代理人案号92171-002410US),提交于201 ...
【技术保护点】
1.一种通过分析自生物体获得的样品来检测生物体的基因组中的半合子缺失的方法,所述方法包括:从所述生物体的多个核酸分子的测序接收序列数据,其中对于所述多个核酸分子的每一个的序列数据包括:所述核酸分子的至少一部分的一个或多个序列读出,和对应所述一个或多个序列读出的标签,所述标签指示所述核酸分子的来源;对于所述多个核酸分子的每一个:通过计算机系统,将所述核酸分子的至少一个序列读出定位到参考基因组;通过计算机系统,鉴定一个或多个连接到第一区域的het,其中每个het具有对应第一单体型的第一等位基因和对应第二单体型的第二等位基因;通过计算机系统,鉴定第一组共享的标签,每个共享的标签对应:定位到所述参考基因组的第一区域的一个或多个序列读出,和定位到一个或多个连接到第一区域的het之一并包括对应的第一等位基因的至少一个序列读出;确定第一量的序列读出,其对应共享的标签并定位到第一区域;标准化所述第一量以获得标准化的第一量;和将所述标准化的第一量与第一截留值比较以确定所述第一单体型在第一区域中是否包括缺失。
【技术特征摘要】
2013.10.01 US 61/885,4701.一种通过分析自生物体获得的样品来检测生物体的基因组中的半合子缺失的方法,所述方法包括:从所述生物体的多个核酸分子的测序接收序列数据,其中对于所述多个核酸分子的每一个的序列数据包括:所述核酸分子的至少一部分的一个或多个序列读出,和对应所述一个或多个序列读出的标签,所述标签指示所述核酸分子的来源;对于所述多个核酸分子的每一个:通过计算机系统,将所述核酸分子的至少一个序列读出定位到参考基因组;通过计算机系统,鉴定一个或多个连接到第一区域的het,其中每个het具有对应第一单体型的第一等位基因和对应第二单体型的第二等位基因;通过计算机系统,鉴定第一组共享的标签,每个共享的标签对应:定位到所述参考基因组的第一区域的一个或多个序列读出,和定位到一个或多个连接到第一区域的het之一并包括对应的第一等位基因的至少一个序列读出;确定第一量的序列读出,其对应共享的标签并定位到第一区域;标准化所述第一量以获得标准化的第一量;和将所述标准化的第一量与第一截留值比较以确定所述第一单体型在第一区域中是否包括缺失。2.权利要求1的方法,其中所述多个核酸分子分布于所述样品的多个等分试样中,每个等分试样包括片段化出所述核酸分子的一个或多个长核酸分子,并且其中所述标签指示所述核酸分子来自哪个等分试样。3.权利要求1的方法,其中两个核酸分子上具有相同的标签指示所述两个核酸分子来自相同的长核酸分子。4.权利要求1的方法,进一步包括:将标准化的第一量与第二截留值比较以确定所述第一单体型在所述第一区域中是否包括插入,其中所述第二截留值小于所述第一截留值。5.权利要求1的方法,进一步包括:将标准化的第一量与第二截留值比较以确定所述第一单体型是否包括对应所述第一区域的扩增,其中所述第二截留值比所述第一截留值大。6.权利要求1的方法,进一步包括:鉴定第二组的第二标签,每个第二标签对应:定位到所述参考基因组的第一区域的一个或多个序列读出,和定位到一个或多个连接到第一区域的het之一并包括对应的第二等位基因的至少一个序列读出;确定第二量的序列读出,其对应所述第二标签并定位到所述第一区域;使用所述第二量来标准化所述第一量。7.权利要求6的方法,其中使用所述第二量来标准化所述第一量包括:计算所述第一量和所述第二量之间的参数。8.权利要求7的方法,其中所述参数包括所述第一量和所述第二量之间的差。9.权利要求7的方法,其中所述参数包括所述第一量和所述第二量之间的比率。10.权利要求7的方法,其中所述第一截留值取决于定位到所述参考基因组的序列读出的数量。11.权利要求1的方法,其中标准化所述第一量使用定位到所述参考基因组的序列读出的数量。12.权利要求11的方法,其中所述第一区域对应连续的位置,且其中标准化所述第一量包括:确定与所述第一区域相同长度的多个其它区域的序列读出的平均数量。13.权利要求12的方法,进一步包括:通过排除具有高于阈值的GC含量或具有大于阈值的序列平均数量的区域,从较大组的区域中选择所述其它区域。14.权利要求1的方法,其中鉴定第一het连接到第一区域包括:鉴定对应定位到所述第一区域的序列读出和对应定位到所述第一het的序列读出的标签。15.权利要求14的方法,其中所述第一het不在第一区域的范围内。16.权利要求1的方法,其中所述第一量是对应所述共享的标签并定位到所述第一区域的序列读出的数量。17....
【专利技术属性】
技术研发人员:BG克马尼,R德马纳克,BA彼得斯,
申请(专利权)人:考利达基因组股份有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。