【技术实现步骤摘要】
肿瘤体细胞突变位点检测方法及其装置
本专利技术涉及生物信息学,具体地说,涉及肿瘤体细胞突变位点检测方法及其装置。
技术介绍
体细胞突变指的是除性细胞外的体细胞发生的突变,一般不会遗传给后代。基因组的不稳定性,会促进细胞中体细胞突变的积累,某些突变会进一步驱动癌症的发生。检测肿瘤细胞的体细胞突变、尤其是肿瘤的驱动突变,是解析肿瘤发生和发展的重要手段,同时可以为肿瘤患者的精准治疗提供重要依据。目前,寻找肿瘤体细胞突变的常用软件如Varscan、GATK、SomaticSniper等软件,生成的vcf文件中,都混有大量的假阳性突变,如何从原始vcf文件中将假阳性位点过滤掉,一直是生物信息学科研人员需要面对的挑战。针对肿瘤的体细胞突变的过滤问题,尚无令人满意、被广泛认可的过滤软件可以一步实现这个功能。目前研究者大多根据位点的特定信息,如位点的突变频率、reads数、链偏、碱基的平均质量等,根据经验自行编写程序甚至人工对位点进行过滤,并没有全面考虑待检测位点与周围位点的情况、所在reads碱基平均错误率、突变碱基在reads上的平均距离、复杂突变、位点人群频率等情况,不能实现过滤一步操作,难以保证过滤的准确性。并且,当样本测序质量较差时,软件运行速度缓慢。
技术实现思路
本专利技术的目的是提供肿瘤体细胞突变位点检测方法及其装置,可实现一步到位完成过滤。为了实现本专利技术目的,第一方面,本专利技术提供一种肿瘤体细胞突变位点检测方法,包括以下步骤:S1、将取自同一肿瘤患者的肿瘤体 ...
【技术保护点】
1.肿瘤体细胞突变位点检测方法,其特征在于,包括以下步骤:/nS1、将取自同一肿瘤患者的肿瘤体细胞样本和白细胞样本分别进行测序,将测序得到的fastq文件与参考基因组序列进行比对,分别对应生成肿瘤体细胞样本bam文件和白细胞样本bam文件;/nS2、利用软件Picard,分别去除肿瘤体细胞样本bam文件和白细胞样本bam文件中PCR扩增导致的冗余序列,再利用Samtools,保留比对到唯一位置的reads,得到修正的肿瘤体细胞样本bam文件和修正的白细胞样本bam文件;/nS3、利用Samtools mpileup和Varscan,用白细胞的数据作为对照,分别获得肿瘤体细胞样本单碱基变异和插入缺失的vcf文件,并用annovar对vcf文件进行注释;/nS4、根据预设的过滤条件对肿瘤体细胞样本的变异检测信息进行过滤,得到真实的肿瘤体细胞突变位点信息结果。/n
【技术特征摘要】
1.肿瘤体细胞突变位点检测方法,其特征在于,包括以下步骤:
S1、将取自同一肿瘤患者的肿瘤体细胞样本和白细胞样本分别进行测序,将测序得到的fastq文件与参考基因组序列进行比对,分别对应生成肿瘤体细胞样本bam文件和白细胞样本bam文件;
S2、利用软件Picard,分别去除肿瘤体细胞样本bam文件和白细胞样本bam文件中PCR扩增导致的冗余序列,再利用Samtools,保留比对到唯一位置的reads,得到修正的肿瘤体细胞样本bam文件和修正的白细胞样本bam文件;
S3、利用Samtoolsmpileup和Varscan,用白细胞的数据作为对照,分别获得肿瘤体细胞样本单碱基变异和插入缺失的vcf文件,并用annovar对vcf文件进行注释;
S4、根据预设的过滤条件对肿瘤体细胞样本的变异检测信息进行过滤,得到真实的肿瘤体细胞突变位点信息结果。
2.根据权利要求1所述的方法,其特征在于,预设的过滤条件为根据位点的突变频率、reads数、链偏、碱基的平均质量、待测位点与周围位点的情况、待测位点所在reads碱基平均错误率、突变碱基在reads上的平均距离、复杂突变、位点人群频率情况进行过滤。
3.根据权利要求1所述的方法,其特征在于,预设的过滤条件按如下步骤进行:
A、第一轮过滤
A1、保留vcf文件中含有SOMATIC和PASS标签的变异位点,同时读取上述变异位点在白细胞样本中的变异频率,只保留白细胞样本中变异频率<1%的位点;
A2、读取位点的refgene注释信息,只保留位于外显子和剪切区域的单碱基变异、只保留位于外显子区域的插入缺失变异;
A3、读取vcf文件中每个位点的DP4信息,只保留变异位点所在reads数>8的位点;
A4、读取vcf文件中每个位点的DP4信息,并计算链偏,去除链偏<10%或>90%且集中在正链的位点;
A5、去除同义突变;
A6、根据千人基因组、exac03、esp6500siv2数据库注释的结果,去除人群频率>0.5%的位点;
A7、对于插入缺失突变,根据插入和缺失的碱基长度,从参考基因组序列中截取该位置前后4倍于该插入缺失碱基长度的序列,与插入缺失碱基进行匹配,将匹配>4次的位点过滤掉;
B、第二轮过滤:经过第一轮过滤所得位点,将位点坐标输出到bed中,利用bam-readcount,读取这些位点的信息,包括位点所在reads上的相对位置、距reads结束的相对位置、突变碱基平均质量值、突变碱基所在reads的碱基平均错误率;
对于插入缺失突变...
【专利技术属性】
技术研发人员:高司航,张静波,李孟键,伍启熹,王建伟,刘倩,唐宇,
申请(专利权)人:北京优迅医学检验实验室有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。