一种检测基因融合的方法及装置制造方法及图纸

技术编号:13158840 阅读:233 留言:0更新日期:2016-05-09 20:43
本发明专利技术公开了一种检测基因融合的方法及装置。其中,该方法包括以下步骤:S1,提取待检测样本的DNA,然后打断、连接接头;S2,使用根据目标基因订制的安捷伦探针利用目标区域捕获的方法捕获目标基因的待检融合中的驱动基因进而得到目标DNA片段;S3,通过高通量测序的方法对目标DNA片段进行测序,得到融合形式的序列;S4,过滤掉低质量的序列后,检测融合形式的序列。应用本发明专利技术的技术方案,通过目标区域捕获技术的捕获常发生融合的基因,仅对常发生融合的基因进行测序,极大的降低了测序成本;另外,利用目标区域捕获下融合驱使基因的单端融合信号加上数据库可以对目标区域捕获的基因数据的融合检出有非常高的灵敏度。

【技术实现步骤摘要】

本专利技术设及生物信息学领域,具体而言,设及一种检测基因融合的方法及装置
技术介绍
[000引基因突变是指基因组DNA分子发生的突然的、可遗传的变异现象(gene mu化tion)。从分子水平上看,基因突变是指基因在结构上发生碱基对组成或排列顺序的改 变。基因虽然十分稳定,能在细胞分裂时精确地复制自己,但运种稳定性是相对的。在一定 的条件下基因也可W从原来的存在形式突然改变成另一种新的存在形式,就是在一个位点 上,突然出现了一个新基因,代替了原有基因,运个基因叫做突变基因。于是后代的表现中 也就突然地出现祖先从未有的新性状。 基因突变是生物进化的重要因素之一,所W研究基因突变除了本身的理论意义W 外还有广泛的生物学意义。基因突变为遗传学研究提供突变型,为育种工作提供素材,所W 它还有科学研究和生产上的实际意义。 有的基因突变是由于染色体发生结构变异形成。在自然条件或人为因素的影响 下,染色体发生的结构变异主要有:缺失、重复、倒位和易位,其中,基因融合也是染色体发 生结构变异的一种。所谓融合基因,是指将两个或多个基因的编码区首尾相连,置于同一套 调控序列(包括启动子、增强子、核糖体结合序列、终止子等)控制之下,构成的嵌合基因。 目前,在二代测序中,常用的基因融合检测方法是基于全基因组的DNA水平上的高 通量测序,同时使用融合基因两端信号,加上统计学检验,判断融合的发生。但是全基因组 测序不可能有高的测序深度,而目标区域捕获的方法一般只设计并捕获常见融合基因的一 端,而另一端不设计探针导致没有信号,运两个问题都会导致融合检测的灵敏度非常低。【专利技术内容】 本专利技术旨在提供一种检测基因融合的方法及装置,W从DNA水平通过高通量测序 技术寻找融合序列,解决基于目标区域捕获的二代测序对于融合检测灵敏度低的技术问 题。 为了实现上述目的,根据本专利技术的一个方面,提供了一种检测基因融合的方法。该 方法包括W下步骤:S1,提取待检测样本的DNA,然后打断、连接接头;S2,使用根据目标基因 订制的安捷伦探针利用目标区域捕获的方法捕获目标基因的待检融合中的驱动基因进而 得到目标DNA片段;S3,通过高通量测序的方法对目标DNA片段进行测序,得到融合形式的序 列;S4,过滤掉低质量的序列后,检测融合形式的序列;S4具体包括:S41,利用比对软件将S3 得到的融合形式的序列与相应的融合形式的参考序列相比对,未比对上的序列形成软截断 序列,并根据比对的位置进行排序,然后建立比对结果的索引文件;S42,将融合形式的序列 的比对结果提取出来,去掉PCR产生的重复序列,找到含有软截断序列的序列,把同一点的 多条序列支持的软截断序列进行组装,得到一致性序列,根据一致性序列过滤掉低质量的 序列,将剩下的符合要求的序列继续比对;其中,要求包括1)含有非相同软截断序列至少4 条,且可W匹配一致性序列;2)含有的不可W匹配一致性序列的软截断序列的个数少于可 W匹配一致性序列的软截断序列的个数;和3) -致性序列大于30nt;S43,检测已知融合形 式:分析S42的比对结果,如果比对到参考序列上的区域在COSMIC数据库中有与第一个断点 发生融合的记录,那么无论比对序列是否有同源序列,都放在结果中,并标记;W及检测新 的融合形式:分析S42的比对结果,如果比对上的区域在COSMIC数据库中没有与第一个断点 发生融合的记录,那么看比对序列是否有同源序列,去除同源性低的比对序列,将剩下结果 输出。[000引进一步地,S41中的比对软件采用的是BWA-mem比对软件,建立比对结果索引文件 采用的软件是samtools软件。 进一步地,S42中的使用Picard软件去掉PCR产生的重复序列。 进一步地,S42中的多条序列为4条序列。[00川进一步地,S43中,同源性低的比对序列是指使用BWA-mem默认参数比对结果中比 对质量小于10的序列。根据本专利技术的另一个方面,提供一种检测基因融合的装置。该装置包括:DNA处理 模块,用于提取待检测样本的DNA,然后打断、连接接头;基因捕获模块,用于使用根据目标 基因订制的安捷伦探针利用目标区域捕获的方法捕获目标基因的待检融合中的驱动基因 进而得到目标DNA片段;测序模块,用于通过高通量测序的方法对目标DNA片段进行测序,得 到融合形式的序列;检测模块,用于过滤掉低质量的序列后,检测融合形式的序列;检测模 块具体包括:序列比对子模块,用于利用比对软件将检测模块得到的融合形式的序列与相 应的融合形式的参考序列相比对,未比对上的序列形成软截断序列,并根据比对的位置进 行排序,然后建立比对结果的索引文件;序列筛选子模块,用于将融合形式的序列的比对结 果提取出来,去掉PCR产生的重复序列,找到含有软截断序列的序列,把同一点的多条序列 支持的软截断序列进行组装,得到一致性序列,根据一致性序列过滤掉低质量的序列,将剩 下的符合要求的序列继续比对;其中,要求包括1)含有非相同软截断序列至少4条,且可W 匹配一致性序列;2)含有的不可W匹配一致性序列的软截断序列的个数少于可W匹配一致 性序列的软截断序列的个数;和3) -致性序列大于30nt(碱基长度);检测已知融合形式子 模块:用于分析序列筛选子模块的比对结果,如果比对到参考序列上的区域在COSMIC数据 库中有与第一个断点发生融合的记录,那么无论比对序列是否有同源序列,都放在结果中, 并标记;W及检测新的融合形式子模块:用于分析序列筛选子模块的比对结果,如果比对上 的区域在COSMIC数据库中没有与第一个断点发生融合的记录,那么看比对序列是否有同源 序列,去除同源性低的比对序列,将剩下结果输出。[001引进一步地,序列筛选子模块中的比对软件采用的是BWA-mem比对软件,建立比对结 果索引文件采用的软件是samtools软件。 进一步地,序列筛选子模块中的使用Picard软件去掉PCR产生的重复序列。 进一步地,序列筛选子模块中的多条序列为4条序列。 进一步地,检测新的融合形式子模块中,同源性低的比对序列是指使用BWA-mem默 认参数比对结果中比对质量小于10的序列。 应用本专利技术的技术方案,结合目标区域捕获技术、高通量测序技术及融合序列信 息分析,提供了一套高灵敏度的从DNA中检测融合的流程。其中,通过目标区域捕获技术的 捕获常发生融合的基因,仅对常发生融合的基因进行测序,极大的降低了测序成本;另外, 利用目标区域捕获下融合驱使基因的单端融合信号加上数据库可W对目标区域捕获的基 因数据的融合检出有非常高的灵敏度。【附图说明】 构成本申请的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示 意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中: 图1示出了根据本专利技术一实施例的检ii基因融合的方法的流程示意图;从及 图2示出了根据本专利技术一实施例的组装软截断序列的步骤与判断可信度的示意 图。【具体实施方式】 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可W相 互组合。下面将参考附图并结合实施例来详细说明本专利技术。 目前,在二代测序中,常用的基因融合检测方法是基于全基因组的DNA水平上的高 通量测序,同时使用融合基因两端本文档来自技高网...

【技术保护点】
一种检测基因融合的方法,其特征在于,包括以下步骤:S1,提取待检测样本的DNA,然后打断、连接接头;S2,使用根据目标基因订制的安捷伦探针利用目标区域捕获的方法捕获所述目标基因的待检融合中的驱动基因进而得到目标DNA片段;S3,通过高通量测序的方法对所述目标DNA片段进行测序,得到融合形式的序列;S4,过滤掉低质量的序列后,检测所述融合形式的序列;所述S4具体包括:S41,利用比对软件将所述S3得到的所述融合形式的序列与相应的融合形式的参考序列相比对,未比对上的序列形成软截断序列,并根据比对的位置进行排序,然后建立比对结果的索引文件;S42,将所述融合形式的序列的比对结果提取出来,去掉PCR产生的重复序列,找到含有所述软截断序列的序列,把同一点的多条序列支持的所述软截断序列进行组装,得到一致性序列,根据所述一致性序列过滤掉低质量的序列,将剩下的符合要求的序列继续比对;其中,所述要求包括1)含有非相同软截断序列至少4条,且可以匹配所述一致性序列;2)含有的不可以匹配所述一致性序列的软截断序列的个数少于可以匹配所述一致性序列的软截断序列的个数;和3)所述一致性序列大于30nt;S43,检测已知融合形式:分析所述S42的比对结果,如果比对到参考序列上的区域在COSMIC数据库中有与第一个断点发生融合的记录,那么无论比对序列是否有同源序列,都放在结果中,并标记;以及检测新的融合形式:分析所述S42的比对结果,如果比对上的区域在COSMIC数据库中没有与所述第一个断点发生融合的记录,那么看比对序列是否有同源序列,去除同源性低的比对序列,将剩下结果输出。...

【技术特征摘要】

【专利技术属性】
技术研发人员:蒋智朱嘉麒张兰英王琰段楠郭阳
申请(专利权)人:北京诺禾致源生物信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1