【技术实现步骤摘要】
使用具有独特分子索引(UMI)的冗余读段在测序DNA片段中抑制误差
[0001]本申请是基于申请日为2016年4月20日,优先权日为2015年4月28日,申请号为201680036120.4,专利技术名称为:“使用具有独特分子索引(UMI)的冗余读段在测序DNA片段中抑制误差”的专利申请的分案申请。
[0002]对相关申请的交叉引用
[0003]本申请要求根据35U.S.C.第119(e)节,于2015年4月28日提交的美国临时专利申请号62/153,699,代理人案卷号ILMNP008P,于2015年7月16日提交的美国临时专利申请号62/193,469,代理人案卷号ILMNP008P2,以及于2015年12月18日提交的美国临时专利申请号62/269,485,代理人案号ILMNP008P3的权益,将其通过引用整体并入本文用于所有目的。
[0004]序列表
[0005]本申请含有序列表,其以ASCII格式电子提交并通过引用以其整体并入本文。创建于2016年4月20日的所述ASCII拷贝命名为ILMNP008WO_ST25.txt并且大小为1164字节。
[0006]专利技术背景
[0007]下一代测序技术正在提供越来越高的测序速度,允许更大的测序深度。然而,由于测序精确度和灵敏度受到各种来源(如样品缺陷、文库制备期间的PCR、富集、成簇和测序)的误差(error)和噪声的影响,单独增加测序的深度不能确保检测到非常低等位基因频率的序列,如母体血浆中的胎儿无细胞DNA(cfDNA)中的序列、循环肿瘤DNA ...
【技术保护点】
【技术特征摘要】
1.使用独特分子索引(UMI)对来自样品的核酸分子测序的方法,其中每个独特分子索引(UMI)是能用于鉴定所述样品中双链DNA片段的单独分子的寡核苷酸序列,所述方法包括:(a)将衔接头应用于所述样品中双链DNA片段的两个末端,其中所述衔接头各自包含双链杂交区、单链5
’
臂、单链3
’
臂、和所述衔接头的一条链或每条链上的物理UMI,从而获得DNA
‑
衔接头产物;(b)扩增所述DNA
‑
衔接头产物的两条链以获得多个扩增的多核苷酸;(c)对所述多个扩增的多核苷酸测序,从而获得多个读段,每个读段与物理UMI相关联;(d)鉴定与所述多个读段相关联的多个物理UMI;(e)鉴定与所述多个读段相关联的多个虚拟UMI,其中每个虚拟UMI是所述样品中DNA片段中发现的序列;以及(f)对于一个或多个所述双链DNA片段中的每个,通过组合(i)具有第一物理UMI和至少一个虚拟UMI但不是第二物理UMI的读段和(ii)具有所述第二物理UMI和所述至少一个虚拟UMI但不是所述第一物理UMI的读段,测定共有核苷酸序列;以及(g)对于所述样品中的一个或多个所述双链DNA片段中的每个,使用所述共有核苷酸序列测定序列。2.权利要求1的方法,其中所述多个物理UMI包含随机UMI。3.权利要求1的方法,其中所述多个物理UMI包含非随机UMI。4.权利要求3的方法,其中每个非随机UMI与所述衔接头的每个其它(every other)非随机UMI相差所述非随机UMI的对应序列位置处的至少两个核苷酸。5.权利要求4的方法,其中所述多个物理UMI包括不超过10,000种独特非随机UMI。6.权利要求5的方法,其中所述多个物理UMI包括不超过1,000种独特非随机UMI。7.权利要求6的方法,其中所述多个物理UMI包括不超过500种独特非随机UMI。8.权利要求7的方法,其中所述多个物理UMI包括不超过约100种独特非随机UMI。9.权利要求8的方法,其中所述多个物理UMI包括约96种独特非随机UMI。10.权利要求1的方法,其中将衔接头应用于双链DNA片段的两个末端包括将所述衔接头连接到所述双链DNA片段的两个末端。11.权利要求1的方法,其中所述多个物理UMI包括少于12个核苷酸。12.权利要求11的方法,其中所述多个MUI包括不超过6个核苷酸。13.权利要求11的方法,其中所述多个UMI包括不超过4个核苷酸。14.权利要求1的方法,其中所述衔接头各自包含所述双链杂交区的每条链上的读段引物序列。15.权利要求1的方法,其中所述衔接头各自包含所述单链5
’
臂或所述单链3
’
臂上在所述衔接头的仅一条链上的物理UMI。16.权利要求15的方法,其中(f)包括:(i)将所述具有第一物理UMI和至少一个虚拟UMI但不是第二物理UMI的读段折拢(collapsing)成第一组以获得第一共有核苷酸序列;(ii)将所述具有第二物理UMI和至少一个虚拟UMI但不是第一物理UMI的读段折拢成第二组以获得第二共有核苷酸序列;以及
(iii)使用所述第一和第二共有核苷酸序列来测定(f)的共有核苷酸序列。17.权利要求16的方法,其中(iii)包括使用所述第一和第二共有核苷酸序列的定位信息和序列信息来获得(f)的共有核苷酸序列。18.权利要求1的方法,其中所述虚拟UMI中的至少一些源自所述样品中所述双链DNA片段的末端处或附近的亚序列。19.权利要求1的方法,其中一个或多个物理UMI和/或一个或多个虚拟UMI与所述样品中双链DNA片段独特地相关联。20.权利要求1的方法,其中所述样品中所述双链DNA片段包含超过约1,000个DNA片段。21.权利要求1的方法,其中所述多个虚拟UMI包含约6bp至约24bp的UMI。22.权利要求21的方法,其中所述多个虚拟UMI包含约6bp至约10bp的UMI。23.权利要求1的方法,其中操作(c)中获得所述多个读段包括:从每个扩增的多核苷酸中获得两个配对末端读段,其中所述两个配对末端读段包含长读段和短读段,所述长读段比所述短读段长。24.权利要求23的方法,其中(f)包括:将与第一物理UMI相关联的读段对组合成第一组并且将与第二物理UMI相关联的读段对组合成第二组,其中所述第一和所述第二物理UMI与所述样品中的双链片段独特地相关联;并且使用所述第一组中长读段的序列信息和所述第二组中长读段的序列信息来测定所述样品中所述双链片段的序列。25.权利要求23的方法,其中所述长读段具有约500bp或...
【专利技术属性】
技术研发人员:S内勒,B郑,E科斯特姆,A阿拉瓦尼斯,A索,X蔡,Z张,
申请(专利权)人:亿明达股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。