一种大片段插入或缺失的预测方法及系统技术方案

技术编号:15823003 阅读:106 留言:0更新日期:2017-07-15 05:07
本发明专利技术公开一种大片段插入或缺失的预测方法及系统,涉及生物信息预测领域。本发明专利技术将组装原理应用于靶向测序的数据来预测大片段插入和缺失,克服了现有技术方法无法正确预测大片段插入和缺失的局限性,充分考虑了原始测序序列之间的关联性,充分保留了原始序列中的杂合信息,得到较长的无测序错误拼接序列,从而正确地预测大片段长度的插入和缺失,运行时间短,预测结果准确,基本无假阳性,操作简单,易使用。

【技术实现步骤摘要】
一种大片段插入或缺失的预测方法及系统
本专利技术涉及生物信息领域,尤其涉及一种应用于靶向测序数据的大片段插入或缺失预测方法及系统。
技术介绍
从2007年第一个个人基因组测序数据诞生之后,测序技术在人类基因组的应用广泛开展。近年来,随着测序技术的不断升级,测序成本也逐年降低,未来即将进入1000元/Gb的时代,也使得重测序技术盛行,广泛应用于个人基因组和癌症基因组,用于检测个人遗传疾病基因变异或者癌症基因变异,包括包括点突变、插入和缺失、基因重排等等基因变异。插入和缺失(InsertionsandDeletions,INDELs)是DNA和蛋白质在进化过程中发生的序列长度上的改变。当基因序列中缺失在某一段位置的序列时,称为缺失(Deletion,DEL);当基因序列中在某一段位置插入一段序列时,称为插入(Insertion,INS)。通常当插入和缺失长度小于10bp时,认为该INDELs为小片段的插入和缺失,而大于10bp或者更长的片段的插入和缺失,认为INDELs为大片段的插入和缺失。插入和缺失作为基因变异的一种形式,在疾病的发展中处于非常重要的作用,特别是随着研究的不断深入,大片本文档来自技高网...
一种大片段插入或缺失的预测方法及系统

【技术保护点】
一种大片段插入或缺失的预测方法,其特征在于,包括:将待测样本目标区域的多条基因测序序列进行筛选以及碱基错误校正处理,获得待测样本目标区域的多条高质量测序序列;对待测样本目标区域的多条高质量测序序列进行基于冗余信息去除的组装处理,获得保留了原始遗传信息且去冗余信息测序序列的组装序列;将所述组装序列与参考序列进行比对,根据比对结果获得大片段插入或缺失的位置信息;其中,所述待测样本目标区域是利用人类参考基因组中的外显子区域或癌症相关的基因区域得到的。

【技术特征摘要】
1.一种大片段插入或缺失的预测方法,其特征在于,包括:将待测样本目标区域的多条基因测序序列进行筛选以及碱基错误校正处理,获得待测样本目标区域的多条高质量测序序列;对待测样本目标区域的多条高质量测序序列进行基于冗余信息去除的组装处理,获得保留了原始遗传信息且去冗余信息测序序列的组装序列;将所述组装序列与参考序列进行比对,根据比对结果获得大片段插入或缺失的位置信息;其中,所述待测样本目标区域是利用人类参考基因组中的外显子区域或癌症相关的基因区域得到的。2.如权利要求1所述的方法,其特征在于,所述的基于冗余信息去除的组装处理包括:对比所述多条高质量测序序列的首尾碱基信息,得到各个高质量测序序列之间首尾交叠关系;通过对所述各个高质量测序序列之间首尾交叠关系的分析,删除所述各个测序序列之间冗余的首尾交叠关系,得到所述各个高质量测序序列之间简化后的首尾交叠关系;根据所述简化的首尾交叠关系,对所述各个高质量测序序列进行组装,得到所述组装序列,使各个高质量测序序列只有单向的一条近邻序列。3.如权利要求1所述的方法,其特征在于,所述利用人类参考基因组中的外显子区域或癌症相关的基因区域得到待测样本目标区域包括:对人类参考基因组中的外显子区域或癌症相关的基因区域进行目标筛选,获得包含人类参考基因组中的所有外显子区域或所有癌症相关的基因区域的靶向基因库;根据所述靶向基因库设计探针,将其与待测样本进行杂交,获得目标区域范围内的待测样本DNA片段;对所述目标区域范围内的待测样本DNA片段进行建库和测序后,得到待测样本目标区域的多条基因测序序列。4.如权利要求1所述的方法,其特征在于,所述将待测样本目标区域的多条基因测序序列进行筛选包括:去掉含有接头序列的所述测序后的基因序列;根据设置的碱基质量阈值,去除低于碱基质量阈值的测序后的基因序列。5.如权利要求1所述的方法,其特征在于,所述将将待测样本目标区域的多条基因测序序列进行碱基错误校正处理是将每条测序序列进行修正使序列上每一个k-mer均为高频。6.如权利要求1所述方法,其特征在于,所述大片段是长度≥10bp的基因片段。7.一种预测大片段插入或缺失的系统,其特征在于,包括:筛选模块,用于筛选待测...

【专利技术属性】
技术研发人员:陈丽娟王凯秦公炜
申请(专利权)人:上海至本生物科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1