基于二代测序的插入缺失突变检测方法、装置和存储介质制造方法及图纸

技术编号:19237016 阅读:51 留言:0更新日期:2018-10-24 01:46
本申请公开了一种基于二代测序的插入缺失突变检测方法、装置和存储介质。本申请方法包括,利用待测样本比对到参考基因组的文件,提取突变等位基因频率大于或等于阈值的候选突变位点集合;过滤去除在短串联重复区域的位点;详细统计各突变位点及其周围的比对信息,包括:InDel位点和参考碱基支持数、比对质量、覆盖深度、周围非参考碱基和其他插入缺失突变情况、周围读段质量;根据统计信息,过滤去除未达设定阈值的位点,得到突变结果。本申请方法,无需局部组装,预先对二代测序数据进行过滤,快速排除大部分由比对造成的假阳性结果,降低检测运行时间和计算资源,提高了检测效率;敏感性和特异性强,能快速精准检测InDel突变。

Insertion deletion mutation detection method, device and storage medium based on two generation sequencing

The present application discloses an insertion deletion mutation detection method, device and storage medium based on second generation sequencing. The application method includes extracting a set of candidate mutation sites whose mutation allele frequencies are greater than or equal to the threshold, filtering out the sites in the short tandem repeat region, and detailed statistics of the mutation sites and their surrounding alignment information, including: InDel sites and reference bases. Support number, alignment quality, coverage depth, peripheral non-reference base and other insertion deletion mutations, peripheral reading quality; according to statistical information, filter out sites that do not reach the set threshold, and get mutation results. This method, without local assembly, filters the second generation sequencing data in advance, quickly eliminates most of the false positive results caused by the comparison, reduces the detection running time and computing resources, improves the detection efficiency, has strong sensitivity and specificity, and can quickly and accurately detect the mutation of InDel.

【技术实现步骤摘要】
基于二代测序的插入缺失突变检测方法、装置和存储介质
本申请涉及基因突变检测领域,特别是涉及一种基于二代测序的插入缺失突变检测方法、装置和存储介质。
技术介绍
癌症是全球最主要的非传染性疾病之一,也是死亡率很高的一种病种,在我国,每年有接近430万人被诊断为癌症,有超过280万人死于癌症。抗肿瘤靶向药物是目前治疗癌症较为有效的手段,部分靶向药的靶点是针对关键基因的插入缺失突变,以下简称InDel突变,发挥作用的。一般临床上建议这些药物在用于肿瘤治疗前对相应的靶标基因进行检测,以确定是否适合使用靶向药或者使用哪种药物。目前常见的检测基因InDel突变的方法有PCR法、一代测序和二代测序,其中一代测序即Sanger测序法。PCR法具有敏感性高的特点,且技术已经成熟,但每对引物只能检测一种突变,无法同时检测太多样品和位点,通量较低,不适用于临床上大量样本的多靶标筛选或检测。Sanger测序法的成本较低,但所需样品用量大,且对低频突变的检测敏感性低。二代测序具有通量高的特点,测序成本也在逐年下降,但目前检测InDel常用的方法工具,例如,Varscan检测特异性不高,Strelka对低频的检测本文档来自技高网...

【技术保护点】
1.一种基于二代测序的插入缺失突变检测方法,其特征在于:包括以下步骤,候选位点提取步骤,包括利用待测样本的测序结果比对到参考基因组的文件,提取突变等位基因频率大于或等于设定的突变等位基因频率阈值的插入缺失突变位点,作为候选突变位点集合;初级过滤步骤,包括过滤去除所述候选突变位点集合中在短串联重复区域的插入缺失突变位点;详细统计步骤,包括详细统计所述候选突变位点集合中各插入缺失突变位点及其周围的比对信息,所述比对信息包括如下至少一项:候选插入缺失突变位点和参考碱基支持数、比对质量、覆盖深度、周围非参考碱基和其他插入缺失突变情况、周围读段质量;高级过滤步骤,包括根据所述详细统计步骤的统计信息,过滤...

【技术特征摘要】
1.一种基于二代测序的插入缺失突变检测方法,其特征在于:包括以下步骤,候选位点提取步骤,包括利用待测样本的测序结果比对到参考基因组的文件,提取突变等位基因频率大于或等于设定的突变等位基因频率阈值的插入缺失突变位点,作为候选突变位点集合;初级过滤步骤,包括过滤去除所述候选突变位点集合中在短串联重复区域的插入缺失突变位点;详细统计步骤,包括详细统计所述候选突变位点集合中各插入缺失突变位点及其周围的比对信息,所述比对信息包括如下至少一项:候选插入缺失突变位点和参考碱基支持数、比对质量、覆盖深度、周围非参考碱基和其他插入缺失突变情况、周围读段质量;高级过滤步骤,包括根据所述详细统计步骤的统计信息,过滤去除未达到设定阈值的插入缺失突变位点,得到插入缺失突变结果。2.一种基于二代测序的插入缺失突变检测方法,其特征在于:包括以下步骤,候选位点提取步骤,包括利用待测样本和对照样本的测序结果比对到参考基因组的文件,提取突变等位基因频率大于或等于设定的突变等位基因频率阈值、且Fisher单边检验的P值小于设定的检验阈值的插入缺失突变位点,作为候选突变位点集合;其中,所述对照样本是与所述待测样本来源于同一检测对象的样本;初级过滤步骤,包括过滤去除所述候选突变位点集合中在短串联重复区域的插入缺失突变位点;对照样本信息提取步骤,包括统计所述候选突变位点集合中对照样本的插入缺失突变位点的支持数和突变等位基因频率;详细统计步骤,包括详细统计所述候选突变位点集合中各插入缺失突变位点及其周围的比对信息,所述比对信息包括如下至少一项:候选插入缺失突变位点和参考碱基支持数、比对质量、覆盖深度、周围非参考碱基和其他插入缺失突变情况、周围读段质量;高级过滤步骤,包括根据所述详细统计步骤的统计信息和所述对照样本信息,过滤去除未达到设定阈值的插入缺失突变位点,得到插入缺失突变结果。3.根据权利要求1或2所述的插入缺失突变检测方法,其特征在于:所述候选位点提取步骤中,所述突变等位基因频率阈值为1%;或者,优选的,所述突变等位基因频率阈值为1%,所述检验阈值为0.1。4.根据权利要求1或2所述的插入缺失突变检测方法,其特征在于:所述详细统计步骤之前,先过滤去除低质量的比对结果,所述低质量的比对结果包括如下至少一项:长度低于设定阈值的读段,碱基质量值低于设定阈值的碱基,插入片段异常的读段,存在多个插入或缺失的读段,低质量碱基占比超过设定阈值的读段,存在错配碱基数超过设定阈值的读段,待检测位点周围存在点错配碱基数超过设定阈值的读段,待检测位点同时被双端的一对读段覆盖但在该位点上碱基不一致的成对读段;优选的,所述对照样本信息提取步骤之前,先过滤去除低质量的比对结果,所述低质量的比对结果包括如下至少一项:长度低于设定阈值的读段,碱基质量值低于设定阈值的碱基,插入片段异常的读段,存在多个插入或缺失的读段,低质量碱基占比超过设定阈值的读段,存在错配碱基数超过设定阈值的读段,待检测位点周围存在点错配碱基数超过设定阈值的读段,待检测位点同时被双端的一对读段覆盖但在该位点上碱基不一致的成对读段。5.根据权利要求1或2所述的插入缺失突变检测方法,其特征在于:所述高级过滤步骤还包括,根据假阳性位点数据库,过滤去除出现在所述假阳性位点数据库中的假阳性位点。6.根据权利要求1或2所述的插入缺失突变检测方法,其特征在于:所述高级过滤步骤中,根据所述详细统计步骤的统计信息,过滤去除未达到设定阈值的插入缺失突变位点,具体包括如下至少一项:1)由比对错误造成的跟下游SNP位点互斥的假阳性插入突变;2)由PCR扩增造成的假阳性突变;3)突变支持数低于设定阈值和/或位点覆盖深度低于设定阈值的结果;4)待测样本中突变等位基因频率低于设定阈值的结果;5)其他低质量或高质量碱基占比超过设定阈值的待检测位点,其中,所述低质量或高质量碱基包括非参考碱基和插入缺失突变;6)在假阳性位点数...

【专利技术属性】
技术研发人员:陈龙昀李淼高志博王佳茜陈超杨洁
申请(专利权)人:深圳裕策生物科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1