一种基于甲基化测序数据进行变异检测的方法及装置制造方法及图纸

技术编号:30904169 阅读:13 留言:0更新日期:2021-11-22 23:49
一种基于甲基化测序数据进行变异检测的方法及装置,该方法包括:候选变异提取步骤,包括提取待测样本测序数据中的候选变异;比对文件提取步骤,包括锁定候选变异所在的基因组区域,提取基因组区域位置的比对文件;重比对步骤,包括将所述比对文件进行重比对,生成重比对之后的比对文件,即重比对文件;鉴定及修正步骤,包括对重比对文件进行转化位点的鉴定,修正转化位点的碱基信息,并重新生成修正碱基之后的比对文件,即修正比对文件;变异检测步骤,包括根据修正比对文件,进行变异检测,获得检测结果。通过重比对、转化位点的鉴定及修复,实现基于甲基化测序数据进行变异检测。实现基于甲基化测序数据进行变异检测。实现基于甲基化测序数据进行变异检测。

【技术实现步骤摘要】
一种基于甲基化测序数据进行变异检测的方法及装置


[0001]本专利技术涉及基因检测领域,具体涉及一种基于甲基化测序数据进行变异检测的方法及装置。

技术介绍

[0002]人类基因组中存在各种各样的突变,包括但核苷酸变异(SNV)、插入缺失变异(InDel)等。其中相当一部分跟肿瘤的形成和发展息息相关。通过基因组测序,从测序的序列数据中,快速准确地鉴定出这些变异,对肿瘤的研究以及治疗有非常大的帮助。
[0003]最近,甲基化测序技术在肿瘤基因组中的应用越来越多。对比于普通的测序技术,甲基化测序技术除了能提供丰富的甲基化修饰信息,同时还能提供基因组变异信息。
[0004]但是甲基化测序会导致DNA上面的碱基信息改变。市面上主流的使用重亚硫酸盐处理的甲基化测序会导致非甲基化的C碱基变换成T。而最近出现的新甲基化测序方法,TET酶和吡啶硼烷结合处理的方法(TAPS)会导致甲基化的C碱基变换成T。这种碱基变换的干扰会影响序列比对以及突变检测。对于普通基因组测序的变异检测软件并不能很好地在甲基化测序数据上面兼容使用。对于单碱基变异(SNP),现时已经有多种方法和软件针对甲基化数据进行处理,例如bis

snp、BS

SNPer、gemBS等。但对于插入缺失突变(INDEL),并没有成熟的方法。其中主要有三方面的问题:第一、甲基化测序的干扰会影响序列比对,特别是容易出现与插入缺失变异密切相关的GAP比对错误,导致插入缺失变异错位;第二、甲基化测序会导致插入序列的改变;第三、不同于SNP,插入缺失突变无法通过修改基因型概率模型,兼容碱基转化的情况,对其进行处理。

技术实现思路

[0005]根据第一方面,在一实施例中,提供一种基于甲基化测序数据进行变异检测的方法,包括:
[0006]候选变异提取步骤,包括提取待测样本测序数据中的候选变异;
[0007]比对文件提取步骤,包括锁定候选变异所在的基因组区域,提取基因组区域位置的比对文件;
[0008]重比对步骤,包括将所述比对文件进行重比对,生成重比对之后的比对文件,即重比对文件;
[0009]鉴定及修正步骤,包括对重比对文件进行转化位点的鉴定,修正转化位点的碱基信息,并重新生成修正碱基之后的比对文件,即修正比对文件;
[0010]变异检测步骤,包括根据修正比对文件,进行变异检测,获得检测结果。
[0011]根据第二方面,在一实施例中,提供一种基于甲基化测序数据进行变异检测的系统,包括:
[0012]候选变异提取装置,用于提取待测样本测序数据中的候选变异;
[0013]比对文件提取装置,用于锁定候选变异所在的基因组区域,提取基因组区域位置
的比对文件;
[0014]重比对装置,用于将所述比对文件进行重比对,生成重比对之后的比对文件,即重比对文件;
[0015]鉴定及修正装置,用于对重比对文件进行转化位点的鉴定,修正转化位点的碱基信息,并重新生成修正碱基之后的比对文件,即修正比对文件;
[0016]变异检测装置,用于根据修正比对文件,进行变异检测,获得检测结果。
[0017]根据第三方面,在一实施例中,提供一种基于甲基化测序数据进行变异检测的装置,包括:
[0018]存储器,用于存储程序;
[0019]处理器,用于通过执行所述存储器存储的程序以实现如第一方面所述的方法。
[0020]根据第四方面,在一实施例中,提供一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
[0021]依据上述实施例的一种基于甲基化测序数据进行变异检测的方法及装置,通过重比对、转化位点的鉴定及修复,实现基于甲基化测序数据进行变异检测。
附图说明
[0022]图1为实施例1中的部分InDel候选集合截图;
[0023]图2为实施例1中的一个InDel位点的比对图;
[0024]图3为实施例1中的重比对图;
[0025]图4为实施例1中位点修复比对图。
具体实施方式
[0026]下面通过具体实施方式结合附图对本专利技术作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
[0027]另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
[0028]本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接,”如无特别说明,均包括直接和间接连接(联接)。
[0029]定义
[0030]本文中,“突变”(mutation)是指生物体、病毒或染色体外DNA基因组核苷酸序列的改变。突变包括小规模突变和大规模突变,小规模突变影响基因中的一个或几个核苷酸,其
中,只影响到一个核苷酸的突变称为点突变。小规模突变包括:1)插入:将一个或多个额外的核苷酸添加到DNA中;2)缺失:从DNA中去除一个或多个核苷酸;3)替换:通常是由化学物质或DNA复制失常引起的替换突变,将基因中的单个核苷酸替换为另一个核苷酸。大规模突变涉及到染色体结构的突变,包括:1)扩增(或基因复制):导致染色体所有区域拷贝数增加,从而增加了染色体中基因的剂量;2)缺失:大片段染色体缺失,导致该区域内基因的丢失。按照遗传性质改变分类,突变分为生殖细胞突变、体细胞突变。本文中,“突变”与“变异”可互换使用。
[0031]本文中,“胚系变异”是指在动物体(尤其指人)的胚胎发育期已经携带的变异(几乎全部遗传自父母)。如果胚系变异存在于体细胞内,则不具有遗传性,如果胚系变异存在于生殖细胞内,则具有遗传性。胚系突变亦称生殖细胞突变,是来源于精子或卵子等生殖细胞的突变,因此,通常生物体中所有细胞都带有胚系突变。
[0032]本文中,“体细胞突变”亦称获得性突变,是在生物体生长、发育过程中或者环境因素影响下后天获得的突变,是指除性细胞外的体细胞发生的突变,通常,生物体中只有部分细胞带有体细胞突变。本文中,“体细胞突变”与“体细胞变异”可互换使用。
[0033]本文中,“DNA甲基化”是DNA化学修饰的一种,可以在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于甲基化测序数据进行变异检测的方法,其特征在于,包括:候选变异提取步骤,包括提取待测样本测序数据中的候选变异;比对文件提取步骤,包括锁定候选变异所在的基因组区域,提取基因组区域位置的比对文件;重比对步骤,包括将所述比对文件进行重比对,生成重比对之后的比对文件,即重比对文件;鉴定及修正步骤,包括对重比对文件进行转化位点的鉴定,修正转化位点的碱基信息,并重新生成修正碱基之后的比对文件,即修正比对文件;变异检测步骤,包括根据修正比对文件,进行变异检测,获得检测结果。2.如权利要求1所述的方法,其特征在于,重比对步骤中,重比对的方法选自多重比对、基于一致性序列的比对中的至少一种。3.如权利要求2所述的方法,其特征在于,所述多重比对具体包括:对所述比对文件进行无参考基因组辅助的多重比对,将多重比对结果与参考基因组进行对齐处理,得到新的比对结果。4.如权利要求2所述的方法,其特征在于,所述基于一致性序列的比对具体包括:将测序序列进行组装,获得组装图,将组装图中的路径比对到参考基因组,获得路径

参考基因组位置对应关系,将测序序列比对到组装图中的所有路径,获得测序序列

路径位置对应关系,选取符合筛选规则的测序序列

路径

参考基因组位置作为新的比对结果。5.如权利要求4所述的方法,其特征在于,将测序序列进行组装的方法包括德布鲁恩图组装法、先重叠后扩展组装法中的至少一种;所述筛选规则包括如下规则中的至少一种:1)综合比对分值最高中的至少一种;2)综合最优比对概率最大。6.如权利要求1所述的方法,其特征在于,鉴定及修正步骤中,转化位点的鉴定方法包括:读取重比对文件,根据每一个基因组位置的比对情况,判断是否呈现出甲基化测序特有的转化模式,鉴定出测序数据中的转化位点位置。7.如权利要求6所述的方法,其特征在于,根据每一个基因组位置的比对情况,判断是否呈现出甲基化测序特有的转化模式,通过过滤,鉴定出测序数据中的转化位点位置。8.如权利要求7所述的方法,其特征在于,根据支持甲基化测序特有的转化模式的测序序列的支持数进行过滤,鉴定出测序数据中的转化位点位置;和/或,根据支持甲基化测序特有的转化模式的测序序列的支持数与阈值的大小关系进行过滤,鉴定出测序数据中的转化位点位置;和/或,如果支持甲基化测序特有的转化模式的测序序列的支持数>阈值,则判断为测序数据中的转化位点位置。9.如权利要求6所述的方法,其特征在于,所述甲基化测序特有的转化模式包括TET辅助吡啶硼烷的甲基化测序法中特有的碱基转化模式、基于重亚硫酸盐转化的甲基化测序法中特有的碱基转化模式中的至少一种。10.如权利要求6所述的方法,其特征在于,所述甲基化测序特有的转化模式包括如下模式中的至少...

【专利技术属性】
技术研发人员:黄毅林浩翔李俊朱彬彬易鑫杨玲
申请(专利权)人:深圳吉因加医学检验实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1