一种基于扩增子二代测序小片段插入缺失检测的方法及装置制造方法及图纸

技术编号:14491075 阅读:294 留言:0更新日期:2017-01-29 13:52
本发明专利技术公开了一种基于扩增子二代测序小片段插入缺失检测的方法及装置。该方法包括以下步骤:S1,分别提取待测样本和阴性对照样本的DNA,多重扩增子扩增与目标性状相关突变的目标区域;S2,通过二代测序得到目标区域的序列;S3,将目标区域的序列与参考基因组相比对,与参考基因组未比对上的碱基形成错配;S4,将由阴性对照样本得到的目标性状相关热点短片段插入缺失的背景噪音,以二项分布作为模型,在每个碱基上区分待测样本中热点短片段插入缺失与背景噪音,如果待测样本的错配碱基所占参考基因型比例与背景噪音有显著区别,那么将错配碱基作为小片段插入缺失阳性检出。应用本发明专利技术,提高了小片段插入缺失检测的准确性。

【技术实现步骤摘要】

本专利技术涉及生物学领域,具体而言,涉及一种基于扩增子二代测序小片段插入缺失检测的方法及装置
技术介绍
多重扩增子二代测序是将感兴趣的基因组区域定制成特异性扩增引物与基因组DNA进行特异性扩增,将目标基因组区域的DNA片段进行富集后再利用第二代测序技术进行测序的研究策略。多重扩增子二代测序是目前基因组学研究中的一个热点技术,主要原因是该技术消耗少量的成本和时间。在相同成本下,研究者可以研究到更多的样本数量和测到更深的深度。作为一个强大、有效的技术,它在新一代高通量测序中发挥独特之处,应用领域越来越广泛。赛默飞公司推出的IonAmpliSeqTM是扩增子二代测序典型产品。通过扩增富集目标区域序列,然后使用proton进行二代测序得到序列具体情况,然后使用统计学检验对样本中低频率的热点短片段插入缺失与测序错误进行区分。但是这种方法检出效果的准确性还待进一步地提高。
技术实现思路
本专利技术旨在提供一种基于扩增子二代测序小片段插入缺失检测的方法及装置,以提高基于扩增子二代测序小片段插入缺失检测的准确性。为了实现上述目的,根据本专利技术的一个方面,提供了一种基于扩增子二代测序小片段插入缺失检测的方法。该方法包括以下步骤:S1,分别提取待测样本和阴性对照样本的DNA,多重扩增子扩增与目标性状相关突变的目标区域,其中,阴性对照样本为目标性状相关基因未突变的样本;S2,通过二代测序得到目标区域的序列;S3,将目标区域的序列与参考基因组相比对,与参考基因组未比对上的碱基形成错配;S4,将由阴性对照样本得到的目标性状相关热点短片段插入缺失的背景噪音,以二项分布作为模型,在每个碱基上区分待测样本中热点短片段插入缺失与背景噪音,如果待测样本的错配碱基所占参考基因型比例与背景噪音有显著区别,那么将错配碱基作为小片段插入缺失阳性检出。进一步的,S4中,如果待测样本的错配碱基所占参考基因型比例与背景噪音相比p-value<1e-6,那么将错配碱基作为小片段插入缺失阳性检出。进一步的,S3中数据信息处理包括:S31,使用TMAP比对软件将目标区域的序列与参考基因组相比对,与参考基因组未比对上的碱基形成错配;S32,使用samtools软件建立比对文件的索引。根据本专利技术的另一方面,提供了一种基于扩增子二代测序小片段插入缺失检测的装置。该装置包括:样本处理装置,用于分别提取待测样本和阴性对照样本的DNA,并多重扩增子扩增与目标性状相关突变的目标区域,其中,阴性对照样本为目标性状相关基因未突变的样本;测序装置,用于通过二代测序得到目标区域的序列;错配碱基获取装置,用于将目标区域的序列与参考基因组相比对,与参考基因组未比对上的碱基形成错配;小片段插入缺失检出装置,用于将由阴性对照样本得到的目标性状相关热点短片段插入缺失的背景噪音,以二项分布作为模型,在每个碱基上区分待测样本中热点短片段插入缺失与背景噪音,如果待测样本的错配碱基所占参考基因型比例与背景噪音有显著区别,那么将错配碱基作为小片段插入缺失阳性检出。进一步的,小片段插入缺失检出装置中,如果待测样本的错配碱基所占参考基因型比例与背景噪音相比p-value<1e-6,那么将错配碱基作为小片段插入缺失阳性检出。进一步的,错配碱基获取装置中包括:TMAP比对软件,用于将目标区域的序列与参考基因组相比对,与参考基因组未比对上的碱基形成错配;samtools软件,用于建立比对文件的索引。应用本专利技术的技术方案,将由阴性对照样本得到的目标性状相关热点短片段插入缺失的背景噪音,以二项分布作为模型,在每个碱基上区分待测样本中热点短片段插入缺失与背景噪音,如果待测样本的错配碱基所占参考基因型比例与背景噪音有显著区别,那么将错配碱基作为小片段插入缺失阳性检出。在某些短片段插入缺失有特定位置和突变型,其中,较长的短片段插入缺失由于其在检测时由于测序或扩增原因造成假阳性检出的概率较低(<0.01%),所以对于不同位置不同长度的短片段插入缺失需要有不同检出阈值,阈值通过阴性对照样本在每个靶向位点的检出情况建立模型得到,对每一个突变以阴性样本中的发生率拟合二项分布作为模型,p-value为1e-6作为阈值,检测其余样本中的突变,这样可以最大限度地检测待测样本中的低频率(0.1%)热点短片段插入缺失,而不产生假阳性检出。附图说明构成本申请的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1示出了根据本专利技术一具体实施方式的基于扩增子二代测序小片段插入缺失检测的方法流程示意图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。在二代测序中,一次测序可以对几十个以上的目标性状相关热点短片段插入缺失进行检测。专利技术人发现,现有技术对所有位点采取同样阈值,而明显由于基因组上序列的差异,在扩增和测序的过程中不同长短的短片段插入缺失的背景噪音会有一定区别,采取同样阈值不能最大限区分序列原因造成的背景噪音与真实突变。本专利技术使用阴性对照样本测序结果得到所有热点短片段插入缺失上的背景噪音分布,以区分在扩增和测序过程中产生的噪音和样本中真实突变,使待测样本中低频率突变的灵敏度和特异度得到提升。根据本专利技术一种典型的实施方式,提供一种基于扩增子二代测序小片段插入缺失检测的方法。该方法包括以下步骤:S1,分别提取待测样本和阴性对照样本的DNA,多重扩增子扩增与目标性状相关突变的目标区域,其中,阴性对照样本为目标性状相关基因未突变的样本;S2,通过二代测序得到目标区域的序列;S3,将目标区域的序列与参考基因组相比对,与参考基因组未比对上的碱基形成错配;S4,将由阴性对照样本得到的目标性状相关热点短片段插入缺失的背景噪音,以二项分布作为模型,在每个碱基上区分待测样本中热点短片段插入缺失与背景噪音,如果待测样本的错配碱基所占参考基因型比例与背景噪音有显著区别,那么将错配碱基作为小片段插入缺失阳性检出。优选的,S4中,如果待测样本的错配碱基所占参考基因型比例与背景噪音相比p-value<1e-6,那么将错配碱基作为小片段插入缺失阳性检出。根据本专利技术一种典型的实施方式,S2中数据信息处理包括:S31,使用TMAP比对软件将目标区域的序列与参考基因组相比对,与参考基因组未比对上的碱基形成错配;S32,使用samtools软件建立比对文件的索引。根据本专利技术一种典型的实施方式,提供一种基于扩增子二代测序小片段插入缺失检测的装置。该装置包括:样本处理装置,用于分别提取待测样本和阴性对照样本的DNA,并多重扩增子扩增与目标性状相关突变的目标区域,其中,阴性对照样本为目标性状相关基因未突变的样本;测序装置,用于通过二代测序得到目标区域的序列;错配碱基获取装置,用于将目标区域的序列与参考基因组相比对,与参考基因组未比对上的碱基形成错配;小片段插入缺失检出装置,用于将由阴性对照样本得到的目标性状相关热点短片段插入缺失的背景噪音,以二项分布作为模型,在每个碱基上区分待测样本中热点短片段插入缺失与背景噪音,如果待测样本的错配碱基所占参考基因型比例与背景噪音有显著区别,那么将错配碱基作本文档来自技高网...
一种基于扩增子二代测序小片段插入缺失检测的方法及装置

【技术保护点】
一种基于扩增子二代测序小片段插入缺失检测的方法,其特征在于,包括以下步骤:S1,分别提取待测样本和阴性对照样本的DNA,多重扩增子扩增与目标性状相关突变的目标区域,其中,阴性对照样本为目标性状相关基因未突变的样本;S2,通过二代测序得到所述目标区域的序列;S3,将所述目标区域的序列与参考基因组相比对,与所述参考基因组未比对上的碱基形成错配;S4,将由所述阴性对照样本得到的目标性状相关热点短片段插入缺失的背景噪音,以二项分布作为模型,在每个碱基上区分所述待测样本中热点短片段插入缺失与所述背景噪音,如果所述待测样本的错配碱基所占参考基因型比例与所述背景噪音有显著区别,那么将所述错配碱基作为小片段插入缺失阳性检出。

【技术特征摘要】
1.一种基于扩增子二代测序小片段插入缺失检测的方法,其特征在于,包括以下步骤:S1,分别提取待测样本和阴性对照样本的DNA,多重扩增子扩增与目标性状相关突变的目标区域,其中,阴性对照样本为目标性状相关基因未突变的样本;S2,通过二代测序得到所述目标区域的序列;S3,将所述目标区域的序列与参考基因组相比对,与所述参考基因组未比对上的碱基形成错配;S4,将由所述阴性对照样本得到的目标性状相关热点短片段插入缺失的背景噪音,以二项分布作为模型,在每个碱基上区分所述待测样本中热点短片段插入缺失与所述背景噪音,如果所述待测样本的错配碱基所占参考基因型比例与所述背景噪音有显著区别,那么将所述错配碱基作为小片段插入缺失阳性检出。2.根据权利要求1所述的方法,其特征在于,所述S4中,如果所述待测样本的错配碱基所占参考基因型比例与所述背景噪音相比p-value<1e-6,那么将所述错配碱基作为小片段插入缺失阳性检出。3.根据权利要求1所述的方法,其特征在于,所述S3中数据信息处理包括:S31,使用TMAP比对软件将所述目标区域的序列与所述参考基因组相比对,与所述参考基因组未比对上的碱基形成错配;S32,使用samtools软件建立比对文件的索引。4.一种基于扩增子二代测序小...

【专利技术属性】
技术研发人员:朱嘉麒王棪张振宇马丽娟
申请(专利权)人:天津诺禾致源生物信息科技有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1