一种诱导全能干细胞应用前期突变检测方法技术

技术编号:13053460 阅读:80 留言:0更新日期:2016-03-23 17:17
本发明专利技术涉及一种诱导全能干细胞应用前期突变检测方法,包括以下步骤,选取多个样本和一个参考基因,分别获取多个样本的测序数据,将多个样本的测序数据分别与参考基因进行比对,分别对应生成多个样本的bam文件;分别去除多个样本的bam文件中PCR扩增导致的偏差,生成多个样本的修正的bam文件;分别获取多个样本的修正的bam文件中的pileup文件;对多个样本的pileup文件进行两两对比,获取多组两个不同样本之间全面的变异检测信息;将多组两个不同样本之间的变异差异信息根据预设的过滤条件进行过滤,得到包含有多组两个不同样本杂合纯和合变异信息结果。本发明专利技术通过对原始数据的比对,按照测序reads覆盖深度进行数据过滤,能够检测到更加全面的突变位点信息。

【技术实现步骤摘要】

本专利技术涉及一种生物信息分析方法,具体的涉及。
技术介绍
目前应用于高通量测序结果中变异筛选的主要软件包括有samtools和GATK。GATK主要用于测序数据中进行突变筛选,包括单核单酸多态性(SNP)以及缺失插入(Indel)等,一般通过BWA+GATK的流程进行数据分析。Samtools是一个用于操作sam和bam文件的工具合集,其中包括了很多命令,其中一个mpileup命令用于生成bcf文件,然后使用bcf too Is进行SNP和Indel的分析。但是无论是samtools的bcf too Is还是GATK分析流程,为了能够找到高质量的变异信息,其分析原理都涉及到了一系列的数据过滤过程。这导致通过上述方法无法获取全部的变异信息。
技术实现思路
本专利技术所要解决的技术问题是提供,可以全面的获取诱导全能干细胞样本的全部的变异信息。本专利技术解决上述技术问题的技术方案如下:,包括以下步骤,S1,选取多个诱导全能干细胞样本和一个参考基因,分别获取多个诱导全能干细胞样本的测序数据,将多个诱导全能干细胞样本的测序数据分别与参考基因进行比对,分别对应生成多个诱导全能干细胞样本的bam文件;S2,分别去除多个诱导全能干细胞样本的bam文件中PCR扩增导致的偏差,生成多个诱导全能干细胞样本的修正的bam文件;S3,分别获取多个诱导全能干细胞样本的修正的bam文件中的pileup文件;S4,通过多个诱导全能干细胞样本的pileup文件对不同诱导全能干细胞样本之间的差异进行两两对比,获取多组两个不同诱导全能干细胞样本之间全面的变异检测信息;S5,将多组两个不同诱导全能干细胞样本之间的变异检测信息根据预设的过滤条件进行过滤,得到包含有多组两个不同诱导全能干细胞样本的杂合和纯合变异信息结果。本专利技术的有益效果是:本专利技术不需要使用多种复杂变异检测软件,利用简单的文件信息方便快捷的获取了诱导全能干细胞样本的全部差异信息,包含基因组上该位点的测序覆盖度,可以直接计算该位点变异比例,进而判断突变是纯合突变还是杂合突变;本专利技术通过对原始数据的比对,按照测序reads覆盖深度进行数据过滤和突变筛选,能够检测到更加全面的突变位点信息。 在上述技术方案的基础上,本专利技术还可以做如下改进。进一步,在S5中,所述预设的过滤条件为根据变异位点的深度支持情况和变异位点的深度占全部测序深度的比例进行过滤。进一步,所述变异位点的深度支持情况具体为变异位点在两个不同诱导全能干细胞样本的reads覆盖深度均大于等于预设值,将多组两个不同诱导全能干细胞样本之间变异位点的reads覆盖深度小于预设值的变异检测信息过滤掉,所述变异位点的深度占全部测序深度的比例包括变异为杂合突变的预设阈值和变异为纯合突变的预设阈值,将多组两个不同诱导全能干细胞样本之间变异位点低于杂合突变预设阈值的变异检测信息过滤掉,将多组两个不同诱导全能干细胞样本之间变异位点低于纯合突变预设阈值的变异检测信息过滤掉,根据多组两个不同诱导全能干细胞样本之间变异位点的reads覆盖深度大于等于预设值的变异检测信息的个数、多组两个不同诱导全能干细胞样本之间变异位点高于等于杂合突变预设阈值的变异检测信息个数和多组两个不同诱导全能干细胞样本之间变异位点高于等于纯合突变预设阈值的变异检测信息个数得出多组两个不同诱导全能干细胞样本的杂合和纯合变异信息结果。进一步,变异位点在两个不同诱导全能干细胞样本的reads覆盖深度均大于等于8,变异为杂合突变的预设阈值为0.25,变异为纯合突变的预设阈值为0.9。进一步,在S5中,多组两个不同诱导全能干细胞样本杂合和纯合变异信息的结果均包括单核单酸多态性变异信息和缺失插入变异信息。进一步,在S5后还包括S6,S6,对得到的缺失插入变异信息进行重复区域过滤,得到进一步过滤的缺失插入变异?目息。进一步,在S4中,变异差异信息包括两个诱导全能干细胞比较样本每个染色体位点的碱基变异以及该变异的覆盖深度信息。进一步,去除多个诱导全能干细胞样本的bam文件中PCR扩增导致的偏差的方法为采用samtools工具中的的rmdup命令。【附图说明】图1为本专利技术的流程图。【具体实施方式】以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。如图1所示,,包括以下步骤,S1,选取多个诱导全能干细胞样本和一个参考基因,分别获取多个诱导全能干细胞样本的测序数据,将多个诱导全能干细胞样本的测序数据分别与参考基因进行比对,分别对应生成多个诱导全能干细胞样本的bam文件,bam文件是sam文件的二进制文件,而sam文件是一种基因序列比对格式标准。S2,分别去除多个诱导全能干细胞样本的bam文件中PCR扩增导致的偏差,生成多个诱导全能干细胞样本的修正的bam文件;去除多个诱导全能干细胞样本的bam文件中PCR扩增导致的偏差的方法为采用samtools工具中的的rmdup命令。S3,分别获取多个诱导全能干细胞样本的修正的bam文件中的pileup文件,pileup文件相当于把每条染色体都竖起来,将每条reads也竖起来平行的匹配到基因组上。S4,通过多个诱导全能干细胞样本的pileup文件对不同诱导全能干细胞样本之间的差异进行两两对比,获取多组两个不同诱导全能干细胞样本之间全面的变异检测信息;变异检测信息包括两个诱导全能干细胞比较样本每个染色体位点的碱基变异以及该变异的覆盖深度?目息。S5,将多组两个不同诱导全能干细胞样本之间的变异检测信息根据预设的过滤条件进行过滤,得到包含有多组两个不同诱导全能干细胞样本杂合和纯合变异信息结果;所述预设的过滤条件为根据变异位点的深度支持情况和变异位点的深度占全部测序深度的比例进行过滤。所述变异位点的深度支持情况具体为变异位点在两个不同诱导全能干细胞样本的reads覆盖深度均大于等于预设值,将多组两个不同诱导全能干细胞样本之间变异位点的reads覆盖深度小于预设值的变异检测信息过滤掉;所述变异位点的深度占全部测序深度的比例包括变异为杂合突变的预设阈值和变异为纯合突变的预设阈值,将多组两个不同诱导全能干细胞样本之间变异位点低于杂合突变预设阈值的变异检测信息过滤掉,将多组两个不同诱导全能干细胞样本之间变异位点低于纯合突变预设阈值的变异检测信息过滤掉,根据多组两个不同诱导全能干细胞样本之间变异位点的reads覆盖深度大于等于预设值的变异检测信息的个数、多组两个不同诱导全能干细胞样本之间变异位点高于等于杂合突变预设阈值的变异检测信息个数和多组两个不同诱导全能干细胞样本之间变异位点高于等于纯合突变预设阈值的变异检测信息个数得出多组两个不同诱导全能干细胞样本的杂合和纯合变异信息结果。变异位点在两个不同诱导全能干细胞样本的reads覆盖深度均大于等于8,变异为杂合突变的预设阈值为0. 25,变异为纯合突变的预设阈值为0. 9。S6,多组两个不同诱导全能干细胞样本杂合纯合变异信息的结果包括单核单酸多态性变异信息和缺失插入变异信息,对得到的缺失插入变异信息进行重复区域过滤,得到进一步过滤的缺失插入变异信息。为本专利技术中提供一个具体的实施例,在本具体实施例中,首先针对供体amniotic细胞、β Thal654_iPS细胞和β Thal本文档来自技高网...

【技术保护点】
一种诱导全能干细胞应用前期突变检测方法,其特征在于:包括以下步骤,S1,选取多个诱导全能干细胞样本和一个参考基因,分别获取多个诱导全能干细胞样本的测序数据,将多个诱导全能干细胞样本的测序数据分别与参考基因进行比对,分别对应生成多个诱导全能干细胞样本的bam文件;S2,分别去除多个诱导全能干细胞样本的bam文件中PCR扩增导致的偏差,生成多个诱导全能干细胞样本的修正的bam文件;S3,分别获取多个诱导全能干细胞样本的修正的bam文件中的pileup文件;S4,通过多个诱导全能干细胞样本的pileup文件对不同诱导全能干细胞样本之间的差异进行两两对比,获取多组两个不同诱导全能干细胞样本之间全面的变异检测信息;S5,将多组两个不同诱导全能干细胞样本之间的变异检测信息根据预设的过滤条件进行过滤,得到包含有多组两个不同诱导全能干细胞样本的杂合和纯合变异信息结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:王成
申请(专利权)人:武汉菲沙基因信息有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1