一种用于检测循环肿瘤DNA样本基因融合的装置制造方法及图纸

技术编号:15640088 阅读:77 留言:0更新日期:2017-06-16 03:41
本发明专利技术涉及一种用于检测循环肿瘤DNA样本基因融合的装置,其包括测序数据获取模块、比对模块、再比对模块、真实融合断点判断模块、以及输出模块。本发明专利技术的用于检测循环肿瘤DNA样本基因融合的装置具有检测速度快、资源要求低、稳定性高的优点。

【技术实现步骤摘要】
一种用于检测循环肿瘤DNA样本基因融合的装置
本专利技术涉及基因融合检测领域,尤其涉及一种用于检测循环肿瘤DNA样本基因融合的装置及方法。
技术介绍
肿瘤细胞会向血液中释放基因组DNA,这些变异DNA也随之释放到外周血中,被称为循环肿瘤DNA(circulatingtumorDNA,ctDNA)。有文献报道称,癌变人群血浆中游离100~400bp大小的DNA片段浓度明显高于正常人,可以作为筛查的标志物。又有研究发现,循环肿瘤DNA在早期原位癌(primarycancer)患者血液中就已经开始出现。由于外周血循环DNA半衰期短,因此循环肿瘤DNA能够真实反映患者病变组织基因突变的真实情况。循环肿瘤DNA在恶性肿瘤诊疗中的应用越来越受到关注和重视,作为研究的热点和突破口将有可能为临床肿瘤的早期诊断、预后判定及疗效监测等提供一系列方便、快捷、特异、无创的分子生物学检测手段。融合基因(Fusiongene)是指两个基因的全部或一部分序列相互融合为一个新的基因的过程,通常具有致癌性,在各种不同的肿瘤中普遍存在。1973年,芝加哥大学的JaneRowley在血液病中发现了第一个融合基因。随后,在诸多实体瘤如肺癌、乳腺癌、前列腺癌、卵巢癌等中相继发现了融合基因的存在。目前越来越多的融合基因在不同肿瘤中被报道。基因融合是一类在临床上非常重要的染色体结构变异,在癌症发生发展过程中起着关键的作用。精准的融合基因检测结果可以为临床抗癌靶点用药治疗和预后评估提供参考依据。传统上用于检测融合基因的检测技术主要基于遗传学方法,如FISH。然而,相对较低的分辨率和通量限制了该种方法在复杂的上皮组织癌的检测中的应用。随着二代测序技术的发展,涌现了大量用于检测融合基因的检测方法。基因融合检测方法中,断点的确认直接影响到检测结果的判定。CREST是当前检测Fusiongene的主流算法之一,该算法利用组装算法实现两次组装,从而排除假阳性,因此其主要优点是假阳性低,但同时由于需要进行两次组装,导致存在检测速度慢、资源要求高、需要进行组装等缺点;同时,组装效果还会受到覆盖度、插入片段长度的影响。血浆中游离DNA含量极微,片段化严重,且循环肿瘤DNA仅占血浆游离DNA总量的0.02%-50%,加之ctDNA的释放量会受到患者病情,癌种,分期,用药情况等各类综合因素的影响,使得ctDNA样本的覆盖度降低,导致这一问题在肿瘤循环DNA样本中表现尤为明显,从而影响融合检测结果。因此,如何应对融合基因检测过程中检测速度慢、系统资源要求高、需要进行组装的问题,特别是低覆盖度样本的检测成为本领域面临的一大难题。
技术实现思路
本专利技术所要解决的技术问题现有技术算法由于需要进行两次组装和三次比对,导致存在检测速度慢、资源要求高等不足之处,同时由于循环肿瘤DNA样本的组装序列均较短且覆盖度较低,对于重复序列的组装存在一定的不确定性,可能会导致检测结果错误。鉴于上述现有技术中存在的问题,本专利技术的目的在于提供一种用于检测基因融合的装置及方法,其具有检测速度快、资源要求低、稳定性高的优点。与现有技术算法相比,本专利技术的检测装置充分利用了PE测序下机测序片段(reads)的信息,减少了比对次数,只需要两次比对,而且不需要组装,提高了检测的稳定性。即,本专利技术包括:一种用于检测循环肿瘤DNA样本基因融合的装置,其包括以下模块:测序数据获取模块,用于获取循环肿瘤DNA样本的测序数据;优选地,所述测序数据是采用双端测序(Paired-endSequencing,PE测序)方法获得的测序数据;比对模块:其与所述测序数据获取模块相连接,用于将获取的测序数据与参考序列进行比对,获取比对结果。所述比对结果包括测序片段在基因中对应的位置信息。所述位置信息包括软剪切信息和成功比对信息。所述测序片段中带有软剪切信息的部分为所述测序片段的软剪切部,所述测序片段中带有成功比对信息的部分为所述测序片段的成功比对部。优选地,该模块可以利用bwa软件,查找测序片段在基因中对应的位置,并形成bam格式文件;优选地,该bam文件中,包括每条测序片段的描述信息(qname),序列信息(seq),比对位置(POS),位标识(flag),比对质量值(MAPQ),简要比对表达信息(Cigar),模板长度(Tlen);再比对模块:其与所述比对模块相连接,用于将带有软剪切信息的测序片段与参考基因组再次比对,获取再比对结果;真实融合断点判断模块:其与所述再比对模块相连接,用于判断所述测序片段的融合断点;以及输出模块:其与所述真实融合断点判断模块相连接,用于输出基因融合检测结果,例如,基因融合断点位置(如left_pos,right_pos),染色体编号(如left_chr,right_chr),支持度(如sup)等。优选地,所述再比对模块例如可以包括以下子模块:长度过滤子模块:其与所述比对模块相连接,用于过滤去除含有软剪切(soft-clipping)信息的测序片段中长度小于一定值的测序片段;优选地,所述一定值可以是例如15~30bp,优选20~25bp。断点判断子模块:其与所述长度过滤子模块相连接,用于根据所述长度过滤子模块的结果数据,将测序片段中带有软剪切信息的部分与带有正常比对信息的部分的结合处作为断点;区分子模块:其与所述断点判断子模块相连接,用于将所述带有软剪切信息的部分和所述带有正常比对信息的部分在断点处分开,并将这两部分的序列信息分别保存至两个文件(例如fastq文件)中;再比对子模块:其与所述区分子模块相连接,用于对所述分别保存了序列信息的两个文件与参考序列再次进行比对,获取再比对结果;优选地,所述再比对结果包括下述信息:每条测序片段的描述信息(qname)、序列信息(seq)、比对位置(POS)、位标识(flag),比对质量值(MAPQ),简要比对表达信息(Cigar),模板长度(Tlen)。优选地,例如可以利用bwa软件对上述两个fastq文件,再次进行比对,形成bam格式文件。所述bam格式文件包含每条测序片段的描述信息(qname),序列信息(seq)、位标识(flag),比对位置(POS),比对质量值(MAPQ),简要比对表达信息(Cigar),模板长度(Tlen)。优选地,所述真实融合断点判断模块可以包括下述子模块:过滤子模块:其与所述再比对子模块相连接,用于根据位标识(flag)值过滤去除未成功比对(unmapped)的测序片段以及低比对质量值(MAPQ)的测序片段;断点信息获取子模块:其与所述过滤子模块相连接,用于查找具有相同片段描述信息(qname)的测序片段,并获取断点信息;优选地,断点信息包括:(1)Left/right_chr,断点左/右侧序列的染色体编号;(2)left/right_pos,断点左/右侧首个碱基的比对位置;(3)left/right_seq,断点左/右侧碱基的序列;(4)sup,断点支持度,支持该断点的测序片段个数。融合断点筛选子模块:其与所述断点信息获取子模块相连接,用于在断点信息中筛选融合断点;融合断点初次合并子模块:其与所述融合断点筛选子模块相连接,用于将具有相同的断点信息的融合断点合并为一个真实融合断点,并将具有相同断点信息的融合断点个数作为真实融本文档来自技高网
...
一种用于检测循环肿瘤DNA样本基因融合的装置

【技术保护点】
一种用于检测循环肿瘤DNA样本基因融合的装置,其包括以下模块:测序数据获取模块,用于获取循环肿瘤DNA样本的测序数据;优选地,所述测序数据是采用双端测序方法获得的测序数据;比对模块:其与所述测序数据获取模块相连接,用于将获取的测序数据与参考序列进行比对,获取比对结果,所述比对结果包括所述测序片段的软剪切信息和成功比对信息;再比对模块:其与所述比对模块相连接,用于将带有软剪切信息的测序片段与参考基因组再次比对,获取再比对结果;真实融合断点判断模块:其与所述再比对模块相连接,用于判断所述测序片段的真实融合断点;以及输出模块:其与所述真实融合断点判断模块相连接,用于输出基因融合检测结果。

【技术特征摘要】
2016.12.29 CN 20161125126691.一种用于检测循环肿瘤DNA样本基因融合的装置,其包括以下模块:测序数据获取模块,用于获取循环肿瘤DNA样本的测序数据;优选地,所述测序数据是采用双端测序方法获得的测序数据;比对模块:其与所述测序数据获取模块相连接,用于将获取的测序数据与参考序列进行比对,获取比对结果,所述比对结果包括所述测序片段的软剪切信息和成功比对信息;再比对模块:其与所述比对模块相连接,用于将带有软剪切信息的测序片段与参考基因组再次比对,获取再比对结果;真实融合断点判断模块:其与所述再比对模块相连接,用于判断所述测序片段的真实融合断点;以及输出模块:其与所述真实融合断点判断模块相连接,用于输出基因融合检测结果。2.根据权利要求1所述的装置,其特征在于,所述比对模块利用bwa软件,查找测序片段在参考序列中对应的位置,获取测序片段的软剪切信息和成功比对信息并形成bam格式文件。3.根据权利要求1或2所述的装置,其特征在于,所述再比对模块包括下述子模块:长度过滤子模块:其与所述比对模块相连接,用于过滤去除含有软剪切信息的测序片段中长度小于一定值的测序片段;断点判断子模块:其与所述长度过滤子模块相连接,用于根据所述长度过滤子模块的结果数据,将测序片段中带有软剪切信息的部分与带有正常比对信息的部分的结合处作为断点;区分子模块:其与所述断点判断子模块相连接,用于将所述带有软剪切信息的部分和所述带有正常比对信息的部分在断点处分开,并将这两部分的序列信息分别保存至两个文件中;再比对子模块:其与所述区分子模块相连接,用于对所述分别保存了序列信息的两个文件与参考序列再次进行比对,获取再比对结果;优选地,所述再比对结果包括:每条测序片段的描述信息(qname)、序列信息(seq)、比对位置(POS)、比对质量值(MAPQ)。4.根据权利要求3所述的装置,其特征在于,所述再比对子模块利用bwa软件对所述两个fastq文件再次进行比对,并形成bam格式文件。5.根据权利要求3所述的装置,其中,所述长度过滤子模块过滤含有软剪切信息的测序片段中长度小于15~25bp的测序片段。6.根据权利要求3所述的装置,其特征在于,所述区分子模块将获取的序列信息保存至fastq文件中。7.根据...

【专利技术属性】
技术研发人员:董永芳荆瑞琳陈利斌隋光磊董超玄兆伶李大为梁峻彬陈重建
申请(专利权)人:安诺优达基因科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1