本发明专利技术公开了一种检测基因融合的方法及装置。其中,该方法包括以下步骤:S1,提取待检测样本RNA,将RNA进行反转录,得到cDNA;S2,在已知的融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序文库;S3,通过高通量的方法对测序文库进行测序,得到融合形式的序列;S4,检测融合形式的序列;S4具体包括:S41,利用比对软件将S3得到的融合形式的序列与相应的融合形式的参考序列相比对;S42,判断S41所得到的数据是否符合分析需求;S43,检测已知融合形式。本方法具有灵敏度高,特异性好且较为经济的优势。
【技术实现步骤摘要】
本专利技术涉及生物学领域,具体而言,涉及一种检测基因融合的方法及装置。
技术介绍
基因突变是指基因组DNA分子发生的突然的、可遗传的变异现象(gene mutation)。从分子水平上看,基因突变是指基因在结构上发生碱基对组成或排列顺序的改 变。基因虽然十分稳定,能在细胞分裂时精确地复制自己,但这种稳定性是相对的。在一定 的条件下基因也可以从原来的存在形式突然改变成另一种新的存在形式,就是在一个位点 上,突然出现了一个新基因,代替了原有基因,这个基因叫做突变基因。于是后代的表现中 也就突然地出现祖先从未有的新性状。 基因突变是生物进化的重要因素之一,所以研宄基因突变除了本身的理论意义以 外还有广泛的生物学意义。基因突变为遗传学研宄提供突变型,为育种工作提供素材,所以 它还有科学研宄和生产上的实际意义。 有的基因突变是由于染色体发生结构变异形成。在自然条件或人为因素的影响 下,染色体发生的结构变异主要有:缺失、重复、倒位和易位,其中,基因融合也是染色体发 生结构变异的一种。所谓融合基因,是指将两个或多个基因的编码区首尾相连,置于同一套 调控序列(包括启动子、增强子、核糖体结合序列、终止子等)控制之下,构成的嵌合基因。 目前常用的检测融合检测方法均是基于DNA水平进行高通量测序,利用CREST、 breakdancer软件等进行染色体结构变异的检测,但不能准确定位到融合断点及融合形式。
技术实现思路
本专利技术旨在提供一种检测基因融合的方法及装置,以解决现有技术中的检测基因 融合的方法不能准确定位到融合断点及融合形式的技术问题。 为了实现上述目的,根据本专利技术的一个方面,提供了一种检测基因融合的方法。该 方法包括以下步骤:S1,提取待检测样本RNA,将RNA进行反转录,得到cDNA ;S2,在已知的 融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序文库;S3, 通过高通量的方法对测序文库进行测序,得到融合形式的序列;S4,检测融合形式的序列; S4具体包括:S41,利用比对软件将S3得到的融合形式的序列与相应的融合形式的参考序 列相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件;S42,判断S41所得 到的数据是否符合分析需求,如果符合分析需求,进行S43,如果不符合分析需求,重复步骤 Sl,S2, S3和S41 ;S43,检测已知融合形式:判读融合形式的序列的比对质量是否足够高, 判读比对融合形式的序列到断点两侧在参考序列中的长度是否满足第一阈值,判读比对融 合形式的序列每侧的序列中错配碱基的比例是否小于第二阈值,如果融合形式的序列同时 满足上述三个条件,则判读该条融合形式的序列支持该已知融合形式,否则该条融合形式 的序列不支持该已知融合形式,如果支持该已知融合形式的融合形式的序列总数大于第三 阈值,则判断该样本中存在该已知融合形式。 进一步地,S41中的比对软件采用的是TMAP比对软件,建立比对结果索引文件采 用的软件是samtools软件。 进一步地,构建测序文库是否成功以五个管家基因的测序序列数的检出情况作为 标准。 进一步地,S42具体包括:利用比对软件比对管家基因,如果五个管家基因测得的 总序列数少于20, 000条,或出现两个或两个以上的管家基因测得的序列数目为0,则不符 合分析需求,重复步骤Sl,S2, S3和S41 ;否则符合分析需求,进行S43。 进一步地,比对管家基因的序列时计算比对到不同外显子的长度至少20个核苷 酸序列。 进一步地,第一阈值为大于等于10个核苷酸;第二阈值为0. 12 ;第三阈值为20 条。 根据本专利技术的另一方面,提供了一种检测基因融合的装置。该装置包括:CDNA获 取模块,用于提取待检测样本RNA,将RNA进行反转录,得到cDNA ;测序文库构建模块,用于 在已知的融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序 文库;测序模块,用于通过高通量的方法对测序文库进行测序,得到融合形式的序列;融合 形式检测模块,用于检测融合形式的序列;融合形式检测模块进一步包括以下子模块:比 对子模块,用于比对软件将测序模块得到的融合形式的序列与相应的融合形式的参考序列 相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件;数据分析子模块,用 于判断比对子模块所得到的数据是否符合分析需求,如果符合分析需求,将数据输入已知 融合形式检测子模块;已知融合形式检测子模块,用于检测已知融合形式:判读融合形式 的序列的比对质量是否足够高,判读比对融合形式的序列到断点两侧在参考序列中的长度 是否满足第一阈值,判读比对融合形式的序列每侧的序列中错配碱基的比例是否小于第二 阈值,如果融合形式的序列同时满足上述三个条件,则判读该条融合形式的序列支持该已 知融合形式,否则该条融合形式的序列不支持该已知融合形式,如果支持该已知融合形式 的融合形式的序列总数大于第三阈值,则判断该样本中存在该已知融合形式。 进一步地,比对子模块中的比对软件采用的是TMAP比对软件,建立比对结果的索 引文件采用的软件是samtools软件。 进一步地,测序文库构建模块中测序文库是否成功以五个管家基因的测序序列数 的检出情况作为标准。 进一步地,比对子模块进一步用于利用比对软件比对管家基因,如果五个管家基 因测得的总序列数少于20, 000条,或出现两个或两个以上的管家基因测得的序列数目为 〇,则不符合分析需求。 进一步地,比对子模块中比对管家基因的序列时计算比对到不同外显子的长度至 少20个核苷酸序列。 进一步地,第一阈值为大于等于10个核苷酸;第二阈值为0. 12 ;第三阈值为20 条。 基因融合的DNA水平上可以表现出很多种形式,若要采用基于DNA的方法进行基 因融合的分析,对测序序列数的覆盖度要求很大,测序的成本将会大大的增加。专利技术提供了 一种基于RNA的分析技术,由于DNA在转录时往往会在固定的位置进行剪接,即便DNA水平 上断点的位置可能会发生变化,在RNA水平上将会仅仅存在少量的剪接形式。针对这些少 量的剪接形式设计PCR引物之后,即可对融合基因进行大规模扩增,即便是微弱的融合信 号在经过扩增之后都能检出明显的融合信号。因此当需要检测已知形式的融合时,相比于 基于DNA的融合检测方法,本方法具有灵敏度高,特异性好且较为经济的优势。【附图说明】 构成本申请的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示 意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中: 图1示出了根据本专利技术一实施例的检测基因融合的方法的流程示意图;以及 图2示出了根据本专利技术一实施例的检测基因融合的结果示意图。【具体实施方式】 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相 互组合。下面将参考附图并结合实施例来详细说明本专利技术。 目前,常用的检测融合检测方法均是基于DNA水平进行高通量测序,如利用 CREST、breakdancer软件等进行染色体结构变异的检测,但不能准确定位到融合断点及融 合形式。针对现有技术中的上述不足,本专利技术提供了以下技术方案。 根据本专利技术一种典型的实施方式,提供一种检测基因融合本文档来自技高网...
【技术保护点】
一种检测基因融合的方法,其特征在于,包括以下步骤:S1,提取待检测样本RNA,将所述RNA进行反转录,得到cDNA;S2,在已知的融合基因的断点两侧设计引物,以所述cDNA为模板扩增出融合形式的序列,构建测序文库;S3,通过高通量的方法对所述测序文库进行测序,得到所述融合形式的序列;S4,检测所述融合形式的序列;所述S4具体包括:S41,利用比对软件将所述S3得到的所述融合形式的序列与相应的融合形式的参考序列相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件;S42,判断所述S41所得到的数据是否符合分析需求,如果符合分析需求,进行S43,如果不符合分析需求,重复步骤S1,S2,S3和S41;S43,检测已知融合形式:判读所述融合形式的序列的比对质量是否足够高,判读比对所述融合形式的序列到断点两侧在所述参考序列中的长度是否满足第一阈值,判读比对所述融合形式的序列每侧的序列中错配碱基的比例是否小于第二阈值,如果所述融合形式的序列同时满足上述三个条件,则判读该条所述融合形式的序列支持该已知融合形式,否则该条所述融合形式的序列不支持该已知融合形式,如果支持该已知融合形式的所述融合形式的序列总数大于第三阈值,则判断该样本中存在该已知融合形式。...
【技术特征摘要】
【专利技术属性】
技术研发人员:蒋智,曹志生,李宗文,张广鑫,张兰英,孟雪红,王玉梅,尹静妮,谭泽民,曹银川,吴晓朦,潘凯,
申请(专利权)人:天津诺禾致源生物信息科技有限公司,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。