【技术实现步骤摘要】
【国外来华专利技术】用短读测序数据检测重复扩增相关申请的交叉引用本申请基于35U.S.C.§119(e)要求于2014年9月12日提交的标题是用短读测序数据检测重复扩增(DETECTINGREPEATEXPANSIONSWITHSHORTREADSEQUENCINGDATA)的美国临时专利申请第62/049,925号的权益,将其通过引用整体并入本文用于所有目的。背景重复扩增是涉及短串联重复序列(STR)多态性的一种特殊类别的微卫星和小卫星变体。当短串联重复序列扩增超过某些大小时,重复扩增由于其不稳定性也被称为动态突变。由不稳定的重复扩增引起的遗传病症尤其包括脆性X综合征(FXS)、亨廷顿病和肌萎缩侧索硬化症(ALS)。鉴定重复扩增在某些遗传病症的诊断和治疗中是重要的。然而,使用未完全跨越重复序列的短读来确定重复序列是困难的。因此,期望开发使用短读来鉴定医学上相关的重复扩增的方法。概述本公开的实施方式涉及用于确定感兴趣的重复扩增,如与遗传病症相关的重复序列的扩增的方法、设备、系统和计算机程序产品。公开的实施方式使用双端测序。提供检测局部遗传区域中的一个或多个重复单元的重复的方法。如果测试 ...
【技术保护点】
确定包含核酸的测试样品中是否存在重复序列的重复扩增的方法,其中所述重复序列包含核苷酸的重复单元的重复,所述方法包括:(a)获得所述测试样品的双端读取,其中所述双端读取已经被处理以与包含所述重复序列的参考序列对齐;(b)鉴定所述双端读取中的锚读取和锚定读取,其中所述锚读取是与重复序列对齐或对齐到所述重复序列附近的读取,并且所述锚定读取是与所述锚读取配对的未对齐的读取;以及(c)至少部分地基于鉴定的锚定读取,确定所述重复扩增是否可能存在于所述测试样品中。
【技术特征摘要】
【国外来华专利技术】2014.09.12 US 62/049,9251.确定包含核酸的测试样品中是否存在重复序列的重复扩增的方法,其中所述重复序列包含核苷酸的重复单元的重复,所述方法包括:(a)获得所述测试样品的双端读取,其中所述双端读取已经被处理以与包含所述重复序列的参考序列对齐;(b)鉴定所述双端读取中的锚读取和锚定读取,其中所述锚读取是与重复序列对齐或对齐到所述重复序列附近的读取,并且所述锚定读取是与所述锚读取配对的未对齐的读取;以及(c)至少部分地基于鉴定的锚定读取,确定所述重复扩增是否可能存在于所述测试样品中。2.如权利要求1所述的方法,其中(c)包括基于鉴定的锚读取和鉴定的锚定读取确定所述重复扩增是否可能存在于所述测试样品中。3.如前述权利要求中任一项所述的方法,其中(c)包括基于鉴定的读取中所述重复单元的重复数目确定重复扩增是否可能存在于所述测试样品中。4.如权利要求3所述的方法,其中(c)包括:获得为高计数读取的鉴定的读取的数目,其中所述高计数读取包括具有比阈值多的重复的读取;以及将所述测试样品中的高计数读取的数目与调用标准进行比较。5.如权利要求4所述的方法,其中高计数读取的阈值为重复的最大数目的至少约80%,该最大数目由双端读取的长度和重复单元的长度计算。6.如权利要求5所述的方法,其中所述高计数读取的阈值为重复的最大数目的至少约90%。7.如权利要求4所述的方法,其中所述调用标准获自对照样品的高计数读取的分布。8.如权利要求4所述的方法,其中由所述双端读取的长度、具有所述重复扩增的序列的长度和测序深度计算所述调用标准。9.如权利要求4所述的方法,其中由所述读取内首次观察到的重复序列与末次观察到的重复序列之间的距离计算所述调用标准。10.如前述权利要求中任一项所述的方法,其中所述锚读取与所述重复序列对齐或在所述重复序列的约5kb内。11.如前述权利要求中任一项所述的方法,其中所述锚读取与所述重复序列对齐或在所述重复序列的约1kb内。12.如前述权利要求中任一项所述的方法,其中所述未对齐的读取包括不能与所述参考序列对齐或与所述参考序列对齐较差的读取。13.如前述权利要求中任一项所述的方法,其中所述参考序列包括参考基因组。14.如前述权利要求中任一项所述的方法,其还包括确定由其获得所述测试样品的个体具有下述之一的升高的风险:脆性X综合征、肌萎缩侧索硬化症(ALS)、亨廷顿病、弗里德赖希共济失调、脊髓小脑性共济失调、脊髓延髓肌肉萎缩症、强直性肌营养不良症、马查多-约瑟夫病或齿状核红核苍白球路易体萎缩症。15.如前述权利要求中任一项所述的方法,其中(c)包括将针对所述测试样品鉴定的读取中所述重复单元的重复数目的分布和一个或多个对照样品的重复数目的分布进行比较。16.如权利要求15所述的方法,其中将所述测试样品的分布与所述对照样品的分布进行比较包括,使用曼-惠特尼秩检验以确定所述测试样品的分布是否在统计学上显著不同于所述对照样品的分布。17.如权利要求16所述的方法,其还包括如果与所述对照样品相比,所述测试样品的分布更多地向较高的重复数目倾斜,并且所述曼-惠特尼秩检验的p值小于约0.0001,则确定所述重复扩增可能存在于所述测试样品中。18.如权利要求17所述的方法,其还包括如果与所述对照样品相比,所述测试样品的分布更多地向较高的重复数目倾斜,并且所述曼-惠特尼秩检验的p值小于约0.00001,则确定所述重复扩增可能存在于所述测试样品中。19.如前述权利要求中任一项所述的方法,其中所述重复数目为框内重复的数目。20.如前述权利要求中任一项所述的方法,其还包括使用测序仪产生来自所述测试样品的双端读取。21.如前述权利要求中任一项所述的方法,其还包括从个体提取所述测试样品。22.如前述权利要求中任一项所述的方法,其中所述测试样品为血液样品、尿样品、唾液样品或组织样品。23.如前述权利要求中任一项所述的方法,其中所述测试样品包括无胎儿和母体细胞的核酸。24.如前述权利要求中任一项所述的方法,其中所述重复单元包含2至50个核苷酸。25.如前述权利要求中任一项所述的方法,其中所述双端读取短于具有所述重复扩增的重复序列。26.如权利要求25所述的方法,其中所述双端读取包括约20bp至1000bp的读取。27.如权利要求26所述的方法,其中所述双端读取包括约50bp至500bp的读取。28.如权利要求27所述的方法,其中所述双端读取包括约80bp至150bp的读取。29.如权利要求25所述的方法...
【专利技术属性】
技术研发人员:迈克尔·A·埃伯利,理查德·肖,
申请(专利权)人:伊鲁米纳剑桥有限公司,
类型:发明
国别省市:英国,GB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。