System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种检测基因融合的方法及装置制造方法及图纸_技高网

一种检测基因融合的方法及装置制造方法及图纸

技术编号:41245928 阅读:3 留言:0更新日期:2024-05-09 23:56
本发明专利技术属于生物信息学领域,具体公开了一种检测基因融合的方法及装置。本发明专利技术的方法通过合并成对的2条reads中存在重叠区域的split reads,再从中选择soft clip的碱基数大于特定阈值的split reads进行分析,提高了可利用split reads的占比,同时也使序列比对结果更加准确,从而提高了检测的灵敏度、特异性和稳定性。进一步通过区分几种融合重排方式,过滤掉不合理重排方式并设置质控标准,提高了检测的准确度和特异性,减少了假阳性结果。相较传统的寻找discordant reads或是对测序片段进行组装的方法,本发明专利技术的方法检测流程更短,能有效缩短检测周期,降低运算资源消耗。

【技术实现步骤摘要】

本专利技术属于生物信息学领域,具体涉及一种检测基因融合的方法及装置


技术介绍

1、基因组发生的结构变异可分为大片段的插入、缺失、倒位、易位等。基因组发生结构变异会导致基因融合及拷贝数变异。由于ngs产生的是短reads,而结构变异一般比较大,因此,对于ngs数据sv的生物信息学分析,一种方法是利用发生结构变异断点位置的reads信息进行判断,例如,根据测序reads比对到参考基因组的情况,将比对到断点位置的reads分为split reads和discordant paired reads。其中,split reads是指一条read一部分比对到基因组的某一位置,另一部分比对到另一个位置;discordant paired reads是指pairend reads关系异常,分为4类:1)插入片段长度过大或过短,2)成对的2条reads分别比对到不同的染色体上,3)成对的2条reads同时比对到正链或负链,4)成对的2条reads中,比对到负链的read在染色体上的位置靠前,比对到正链的read在染色体上的位置靠后。此外,还可以利用局部de novo组装的方法,将短reads组装成长序列,再将组装后的长序列比对到参考基因组,进而判断出结构变异发生的位置。例如,中国专利cn106909806b(华大基因)公开的一种检测融合基因突变的方法,包括:获取待测样本的测序结果;提取测序结果中的割裂读段(即split reads);分析匹配到参考序列上相同位置的割裂读段的数量,确定候选断点;截取匹配到第一融合基因位置的割裂读段的不匹配所述第一融合基因位置的部分,以获得第一割裂片段,将第一割裂片段进行组装,获得第一一致性序列,定义参考序列上候选断点相应位置为第一融合基因位置;将第一一致性序列与参考序列进行比对,定义第一一致性序列与参考序列匹配的位置为第二融合基因位置;截取匹配到第二融合基因位置的割裂读段的不匹配所述第二融合基因位置的部分,获得第二割裂片段,将第二割裂片段进行组装,获得第二一致性序列;将第二一致性序列与参考序列进行比对,若第二一致性序列与参考序列匹配的位置为第一融合基因位置,确定存在融合基因突变。

2、此外,中国专利cn108368546b(guardant health)公开了一种通过处理来自样品的遗传序列读段数据进行无细胞dna分析中基因融合检测的方法,包括:确定包含融合染色体dna分子的至少一部分的测序数据的融合读段;确定基因组上的预定点,其中融合读段的至少一个映射部分在预定点,即断点处剪切;将来自两个断点,即断点对的两个映射读段部分识别为潜在融合候选;基于断点对创建多于一个融合集,并将融合集聚类到多于一个融合簇中,其中具有相距不超过25个核苷酸的断点的融合集被分组到一个融合簇中;将符合预定标准的每一个融合簇识别为基因融合,预定标准包括:i)在簇中具有多于一个分子,和/或ii)具有至少一个具有沃森和克里克链两者的分子。该方法可以准确识别发生基因融合的基因座,从而提高癌症诊断的准确性。

3、然而,现有的检测基因融合的方法大多存在假阳性率高、低融合频率下敏感性低、流程耗时长等缺陷,无法满足临检生产尤其是液体活检的敏感性要求。因此,亟待开发一种灵敏度和特异性高、稳定性好的基因融合检测方法,简化分析步骤,缩短运行时间,提高融合事件检测的准确性和及时性。


技术实现思路

1、本专利技术主要解决的技术问题是提供一种检测基因融合的方法,充分利用双端测序数据的信息对split reads进行处理、筛选和分析,确定融合的重排方式及融合断点对,提高检测的准确度、灵敏度、特异性和稳定性,缩短检测周期,降低运算资源消耗。

2、同时,本专利技术提供一种检测基因融合的装置。

3、为解决上述技术问题,本专利技术采用以下技术方案:

4、一种检测基因融合的方法,包括:

5、(1)获得待测样品的测序结果,与参考序列比对后提取split reads;

6、(2)合并成对的2条reads中存在重叠区域的split reads,重新比对后选择softclip的碱基数大于阈值的新的split reads;

7、(3)对新的split reads进行分析,确定融合的重排方式及融合断点对;

8、(4)根据重排方式以及融合断点对的split reads数,输出基因融合的检测结果。

9、作为本专利技术一种优选的实施方案,步骤(2)中,当重叠区域的碱基数不少于8时,合并成对的2条reads。

10、作为本专利技术一种优选的实施方案,步骤(2)中,所述阈值为15,更优选为20。

11、作为本专利技术一种优选的实施方案,步骤(3)中,所述对新的split reads进行分析,还包括获取以下信息中的一项或多项:split reads的位置,split reads覆盖的基因对,split reads所覆盖基因对的转录顺序(a-b或b-a,如图3所示)。

12、作为本专利技术一种优选的实施方案,步骤(3)中,所述融合的重排方式包括:染色体内删除,染色体内倒位,染色体内复制插入,染色体间同臂异位,染色体间异臂异位。其中,染色体内删除、倒位、复制插入由染色体内部的结构变异引起,染色体间同臂异位、异臂异位由染色体间的结构变异引起。

13、具体的,当染色体内部出现片段删除时,如图4a所示,两个断点(即断点a、断点b)在相同的染色体上,且split reads在不同断点处的soft clip的朝向相对,即在断点a处的soft clip在断点的右侧,在断点b处的soft clip在断点的左侧。

14、具体的,当染色体内部出现倒位时,如图4b所示,两个断点在相同的染色体上,且split reads在不同断点处的soft clip的朝向相同,即在断点a、断点b处的soft clip都在断点的右侧。

15、具体的,当染色体内部出现片段复制插入时,如图4c所示,两个断点在相同的染色体上,且split reads在不同断点处的soft clip的朝向相反,即在断点a处的soft clip在断点的左侧,在断点b处的soft clip在断点的右侧。

16、具体的,当染色体间出现同臂异位(不跨越着丝粒)时,如图4d所示,两个断点在不同的染色体上,且split reads在不同断点处的soft clip的朝向相反。

17、具体的,当染色体间出现异臂异位(跨越着丝粒)时,如图4e所示,两个断点在不同的染色体上,且split reads在不同断点处的soft clip的朝向相同。

18、作为本专利技术一种优选的实施方案,步骤(3)中,所述确定融合断点对的方法包括:基于断点对创建多个融合集,并将多个融合集聚类到一个融合簇中,分析每个断点支持的split reads数,据此确定融合断点对。

19、具体的,所述确定融合断点对的方法可以参照guardant health的专利cn108368546b提供的方案。本文档来自技高网...

【技术保护点】

1.一种检测基因融合的方法,其特征在于:所述方法包括:

2.根据权利要求1所述的方法,其特征在于:步骤(2)中,所述阈值为15。

3.根据权利要求1所述的方法,其特征在于:步骤(3)中,所述对新的split reads进行分析,还包括获取以下信息中的一项或多项:split reads的位置,split reads覆盖的基因对,split reads所覆盖基因对的转录顺序。

4.根据权利要求1所述的方法,其特征在于:步骤(3)中,所述融合的重排方式包括:染色体内删除,染色体内倒位,染色体内复制插入,染色体间同臂异位,染色体间异臂异位。

5.根据权利要求1所述的方法,其特征在于:步骤(3)中,所述确定融合断点对的方法包括:基于断点对创建多个融合集,并将多个融合集聚类到一个融合簇中,分析每个断点支持的split reads数,据此确定融合断点对。

6.根据权利要求4所述的方法,其特征在于:步骤(4)中,过滤去除除以下重排方式外的其他重排方式:染色体内删除,染色体内倒位,染色体内复制插入,染色体间同臂异位,染色体间异臂异位。p>

7.根据权利要求1或6所述的方法,其特征在于:步骤(4)中,所述融合断点对的splitreads数至少为3个。

8.根据权利要求1或7所述的方法,其特征在于:步骤(4)中,根据重排方式、融合断点对的split reads数以及以下质控标准中的一项或多项,输出基因融合的检测结果;

9.一种专用于实施权利要求1-8中任一项所述的检测基因融合的方法的装置,其特征在于:包括以下模块:

10.根据权利要求9所述的装置,其特征在于:所述装置还包括以下一个或多个模块:

...

【技术特征摘要】

1.一种检测基因融合的方法,其特征在于:所述方法包括:

2.根据权利要求1所述的方法,其特征在于:步骤(2)中,所述阈值为15。

3.根据权利要求1所述的方法,其特征在于:步骤(3)中,所述对新的split reads进行分析,还包括获取以下信息中的一项或多项:split reads的位置,split reads覆盖的基因对,split reads所覆盖基因对的转录顺序。

4.根据权利要求1所述的方法,其特征在于:步骤(3)中,所述融合的重排方式包括:染色体内删除,染色体内倒位,染色体内复制插入,染色体间同臂异位,染色体间异臂异位。

5.根据权利要求1所述的方法,其特征在于:步骤(3)中,所述确定融合断点对的方法包括:基于断点对创建多个融合集,并将多个融合集聚类到一个融合簇中,分析每个断点支持...

【专利技术属性】
技术研发人员:丁宝旭舒静超董超张银张晓亮张瑞峰
申请(专利权)人:郑州安图生物工程股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1