【技术实现步骤摘要】
基因的动态突变检测方法、装置、设备及存储介质
[0001]本专利技术涉及数字医疗
,尤其涉及一种基因的动态突变检测方法、装置、设备及存储介质。
技术介绍
[0002]动态突变是在减数分裂或体细胞的有丝分裂过程中发生扩增而造成遗传物质的不稳定状态。动态突变是导致人类遗传病的一种新的基因突变类型,是基因的编码区或非编码区发生核苷酸重复序列异常扩增,涉及到神经系统的很多疾病。其发病机制与这些重复序列的重复次数明确相关,绝大部分此类序列变异无法通过sanger测序(一代测序)技术检出,目前常规的检测手段为TP
‑
PCR(聚合酶链反应),该检测手段的实验成本高、耗时长、检测效率低。
技术实现思路
[0003]基于此,有必要针对采用TP
‑
PCR检测基因的动态突变时,存在实验成本高、耗时长、检测效率低的技术问题,提出了一种基因的动态突变检测方法、装置、设备及存储介质。
[0004]本申请提出了一种基因的动态突变检测方法,所述方法包括:
[0005]获取目标二代测序 ...
【技术保护点】
【技术特征摘要】
1.一种基因的动态突变检测方法,所述方法包括:获取目标二代测序数据对应的样本比对BAM文件;基于预设的动态突变位置定义文件,分别从所述样本比对BAM文件中提取每种动态突变覆盖的reads,得到覆盖BAM文件;对所述覆盖BAM文件进行单方向拆分和序列信息提取,得到正向BAM文件、第一正向Fasta文件、反向BAM文件和第一反向Fasta文件;对所述第一正向Fasta文件和所述第一反向Fasta文件均依次进行文件处理、文件校正、一级序列比对和二级序列比对,得到正向校正Fasta文件、第二正向Fasta文件、反向校正Fasta文件和第二反向Fasta文件;根据所述正向BAM文件、所述反向BAM文件、所述第二正向Fasta文件、所述第二反向Fasta文件、所述正向校正Fasta文件和所述反向校正Fasta文件进行检测结果生成,得到目标检测结果。2.根据权利要求1所述的基因的动态突变检测方法,其特征在于,所述获取目标二代测序数据对应的样本比对BAM文件的步骤之前,包括:获取目标基因组;采用二代测序技术和预设的测序范围,对所述目标基因组进行测序,得到所述目标二代测序数据;对所述目标二代测序数据依次进行FastQC质控、BWA比对及GATK分析,得到所述样本比对BAM文件。3.根据权利要求1所述的基因的动态突变检测方法,其特征在于,所述基于预设的动态突变位置定义文件,分别从所述样本比对BAM文件中提取每种动态突变覆盖的reads,得到覆盖BAM文件的步骤之前,还包括:分别根据每种所述动态突变对应的基因在预设的参考基因组中的位置定义Bed文件,得到所述动态突变位置定义文件;其中,所述动态突变的取值范围包括:UGT1A1突变、NOTCH2NLC突变、AR突变、ATXN1突变、ATXN7突变、TBP突变、ATN1突变、ATXN2突变、ATXN3突变、CACNA1A突变和JPH3突变。4.根据权利要求1所述的基因的动态突变检测方法,其特征在于,所述对所述第一正向Fasta文件和所述第一反向Fasta文件均依次进行文件处理、文件校正、一级序列比对和二级序列比对,得到正向校正Fasta文件、第二正向Fasta文件、反向校正Fasta文件和第二反向Fasta文件的步骤,包括:对所述第一正向Fasta文件依次进行N碱基去除、reads名称唯一性处理和删除小于预设碱基数量的reads,得到正向处理Fasta文件,对所述第一反向Fasta文件依次进行N碱基去除、reads名称唯一性处理和删除小于预设碱基数量的reads,得到反向处理Fasta文件;对所述正向处理Fasta文件进行文件校正,得到所述正向校正Fasta文件,对所述反向处理Fasta文件进行文件校正,得到所述反向校正Fasta文件;对所述正向校正Fasta文件依次进行一级序列比对和二级序列比对,得到所述第二正向Fasta文件,对所述反向校正Fasta文件依次进行一级序列比对和二级序列比对,得到所述第二反向Fasta文件。5.根据权利要求4所述的基因的动态突变检测方法,其特征在于,所述对所述正向处理
Fasta文件进行文件校正,得到所述正向校正Fasta文件,对所述反向处理Fasta文件进行文件校正,得到所述反向校正Fasta文件的步骤,包括:对所述正向处理Fasta文件进行每种动态突变覆盖的reads和未测通的reads的抓取,得到各个单基因正向数据;将ATXN1突变对应的所述单基因正向数据和ATXN3突变对应的所述单基因正向数据进行合并处理,得到待分析正向数据;获取所述ATXN1突变对应的第一基因特征序列和所述ATXN3突变对应的第二基因特征序列;根据所述第一基因特征序列,从所述待分析正向数据中查找覆盖的reads和未测通的reads,得到第一正向分组数据,根据所述第二基因特征序列,从所述待分析正向数据中查找覆盖的reads和未测通的reads,得到第二正向分组数据;将所述第一正向分组数据、所述第二正向分组数据和所述待分析正向数据以外的各个所述单基因正向数据,作为所述正向校正Fasta文件;对所述反向处理Fasta文件进行每种动态突变覆盖的reads和未测通的reads的抓取,得到各个单基因反向数据;将所述ATXN1突变对应的所述单基因反向数据和所述ATXN3突变对应的所述单基因反向数据进行合并处理,得到待分析正向数据;根据所述第一基因特征序列,从所述待分析反向数据中查找覆盖的reads和未测通的,得到第一反向分组数据,根据所述第二基因特征序列,从所述待分析反向数据中查找覆盖的reads和未测通的reads,得到第二反向分组数据;将所述第一反向分组数据、所述第二反向分组数据和所述待分析正向数据以外的各个所述单基因反向数据,作为所述反向校正Fasta文件。6.根据权利要求4所述的基因的动态突变检测方法,其特征在于,所述对所述正向校正Fasta文件依次进行一级序列比对和二级序列比对,得到所述第二正向Fasta文件,对所述反向校正Fasta文...
【专利技术属性】
技术研发人员:喻长顺,李冬梅,赵丽丽,王燕霞,李玉静,陈建春,贾晓冬,李行,汲珊珊,
申请(专利权)人:天津金域医学检验实验室有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。