一种同时检测甲基化和突变信息的方法及装置制造方法及图纸

技术编号:35792577 阅读:15 留言:0更新日期:2022-12-01 14:42
一种同时检测甲基化和突变信息的方法及装置,该方法包括:甲基化检测步骤,包括将模板链分为XM模板链、F1R2模板链、F2R1模板链,如果XM模板链存在错配,则预测为突变,如果F2R1模板链存在C到T的错配,则预测为突变,如果F1R2模板链存在G到A的错配,则预测为突变;XM模板链和F1R2模板链的G到A突变,以及F2R1模板链的C到T突变用于校正甲基化中由于突变导致的误差;突变统计步骤,包括使用F1R2的甲基化频率或者F2R1的甲基化频率校正突变的频率,获得校正后的突变频率。本发明专利技术通过在突变检测之间进行甲基化检测,使得甲基化和突变检测的结果更加精确,并能实现一次检测获得多组学数据的目标。标。标。

【技术实现步骤摘要】
一种同时检测甲基化和突变信息的方法及装置


[0001]本专利技术涉及生物信息学领域,具体涉及一种同时检测甲基化和突变信息的方法及装置。

技术介绍

[0002]DNA甲基化(DNA Methylation)为DNA化学修饰的一种形式,能够在不改变DNA序列的前提下,改变遗传表现。DNA甲基化是到目前为止研究最为深入的表观遗传调控机制之一。这种修饰是真核细胞内正常而普遍的修饰方式,但是基因表达受影响。甲基化修饰有多种方式,被修饰位点的碱基可以是腺嘌呤的N

6位、胞嘧啶的N

4位、鸟嘌呤的N

7位和胞嘧啶的C

5位,它们分别由不同的DNA甲基化酶催化。尽管修饰方式多种多样,但是绝大多数甲基化发生在基因的转座子区域以及基因区域上,相对来说,CpG岛的甲基化程度较低(10%)。研究表明,启动子区域的高甲基化导致抑癌基因失活是人类肿瘤所具有的共同特征之一。
[0003]2019年,有研究人员开发出了一种新型测序技术——TET辅助吡啶硼烷测序技术(TET

assisted pyridine borane sequencing,下文简称TAPS)。TAPS无需亚硫酸氢盐,可对目标序列直接进行DNA甲基化测序,是一种破坏性更小、效率更高的单碱基分辨率DNA甲基化测序方法。与BS(bisulfite sequencing,亚硫酸氢盐测序)相比,TAPS数据的处理速度不仅快了2倍,而且还能保留样本更多的原始信息,使得在DNA甲基化检测中,基因突变检测和结构变异检测变得更加容易。TAPS的覆盖范围更均匀,定位效率更高,可以生成更精确的测序数据。此外,TAPS测序成本仅为WGBS的一半。这意味着,相同投入下,TAPS可以获得两倍多的有效数据,有助于进行更高质量、更全面的基因分析。
[0004]然而,目前的TAPS技术和配套的检测软件astair主要针对全基因组的甲基化测序,不能针对特定癌种进行区域富集,并且其只能检测甲基化,不能检测突变,会导致甲基化状态识别可能受到突变的影响,精确度不够。
[0005]现有技术没有考虑到甲基化和突变共存的情况,比如一个C位点同时发生了C

T的突变和C

T的甲基化,则其甲基化和突变的检出频率均是单独计算,没有考虑联合的情况。

技术实现思路

[0006]根据第一方面,在一实施例中,提供一种同时检测甲基化和突变信息的方法,包括:
[0007]甲基化检测步骤,包括根据待测样本测序数据中的模板链是否包含XM标签,将模板链分为XM模板链、F1R2模板链、F2R1模板链,F表示正向模板链,F1R2表示由正向模板链复制和测序得到的数据,R表示反向模板链,F2R1表示由反向模板链复制和测序得到的数据,XM模板链和F1R2模板链用于统计C到T正链甲基化,XM模板链和F2R1模板链用于统计G到A负链甲基化;如果XM模板链存在错配,则预测为突变,如果F2R1模板链存在C到T的错配,则预
测为突变,如果F1R2模板链存在G到A的错配,则预测为突变;XM模板链和F1R2模板链的G到A突变,以及F2R1模板链的C到T突变用于校正甲基化中由于突变导致的误差;
[0008]突变统计步骤,包括使用F1R2模板链的甲基化频率或者F2R1模板链的甲基化频率校正突变的频率,获得校正后的突变频率。
[0009]根据第二方面,在一实施例中,提供一种同时检测甲基化和突变信息的装置,包括:
[0010]甲基化检测模块,用于根据待测样本测序数据中的模板链是否包含XM标签,将模板链分为XM模板链、F1R2模板链、F2R1模板链,F表示正向模板链,F1R2表示由正向模板链复制和测序得到的数据,R表示反向模板链,F2R1表示由反向模板链复制和测序得到的数据,XM模板链和F1R2模板链用于统计C到T正链甲基化,XM模板链和F2R1模板链用于统计G到A负链甲基化;其中,如果XM模板链存在错配,则预测为突变,如果F2R1模板链存在C到T的错配,则预测为突变,如果F1R2模板链存在G到A的错配,则预测为突变;XM模板链和F1R2模板链的G到A突变,以及F2R1模板链的C到T突变用于校正甲基化中由于突变导致的误差;
[0011]突变统计模块,用于使用F1R2模板链的甲基化频率或者F2R1模板链的甲基化频率校正突变的频率,获得校正后的突变频率。
[0012]根据第三方面,在一实施例中,提供一种装置,包括:
[0013]存储器,用于存储程序;
[0014]处理器,用于通过执行所述存储器存储的程序以实现如第一方面所述的方法。
[0015]根据第四方面,在一实施例中,提供一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
[0016]依据上述实施例的一种同时检测甲基化和突变信息的方法及装置,本专利技术通过在突变检测之间进行甲基化检测,使得甲基化和突变检测的结果更加精确,并能实现一次检测获得多组学数据的目标。
附图说明
[0017]图1为TET辅助吡啶硼烷测序流程图。
[0018]图2为一种实施例的甲基化位点IGV图。
[0019]图3为一例C

T甲基化的位点模板链的分布情况图。
具体实施方式
[0020]下面通过具体实施方式结合附图对本专利技术作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
[0021]另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易
见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
[0022]本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。
[0023]如本文所用,“突变”是指生物体、病毒或染色体外DNA基因组核苷酸水平的改变,通常是单个核苷酸的变异和小片段的indel。本文中,“突变”与“变异”可互换使用。
[0024]如本文所用,“CpG”是5'

C

磷酸

G

3'的简写,沿着5'

3'方向上胞嘧本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种同时检测甲基化和突变信息的方法,其特征在于,包括:甲基化检测步骤,包括根据待测样本测序数据中的模板链是否包含XM标签,将模板链分为XM模板链、F1R2模板链、F2R1模板链,F表示正向模板链,F1R2表示由正向模板链复制和测序得到的数据,R表示反向模板链,F2R1表示由反向模板链复制和测序得到的数据,XM模板链和F1R2模板链用于统计C到T正链甲基化,XM模板链和F2R1模板链用于统计G到A负链甲基化;如果XM模板链存在错配,则预测为突变,如果F2R1模板链存在C到T的错配,则预测为突变,如果F1R2模板链存在G到A的错配,则预测为突变;XM模板链和F1R2模板链的G到A突变,以及F2R1模板链的C到T突变用于校正甲基化中由于突变导致的误差;突变统计步骤,包括使用F1R2模板链的甲基化频率或者F2R1模板链的甲基化频率校正突变的频率,获得校正后的突变频率。2.如权利要求1所述的方法,其特征在于,甲基化检测步骤中,包括根据物理位置和唯一分子标签聚簇,将F1R2模板链和F2R1模板链合并为大簇。3.如权利要求2所述的方法,其特征在于,甲基化检测步骤中,如果大簇同时包含F1R2模板链和F2R1模板链,则预测该簇包含双链模板链,将F1R2模板链和F2R1模板链合并为一个模板链,将甲基化信息记录在XM标签上。4.如权利要求1所述的方法,其特征在于,甲基化检测步骤中,将包含XM标签的模板链分为XM模板链,将不包含XM标签的模板链分为F1R2模板链、F2R1模板链;甲基化检测步骤中,如果存在如下情况中的至少一种,则在合并过程中修复甲基化:A)正向模板链和反向模板链只发生甲基化修饰;B)单链甲基化和真实突变同时发生;C)氧化损伤;优选地,甲基化检测步骤中,所述C到T正链甲基化是指5mC、5hmC中的至少一种到T正链甲基化;优选地,甲基化检测步骤中,所述C到T正链甲基化是指5mC和5hmC到T正链甲基化;优选地,甲基化检测步骤中,所述C到T正链甲基化是指5mC或5hmC到T正链甲基化;优选地,甲基化检测步骤中,在合并过程中修复甲基化时,将C到T的转变记录为Z,G到A的转变记录为z。5.如权利要求1所述的方法,其特征在于,突变统计步骤,突变频...

【专利技术属性】
技术研发人员:刘涛李敏何俊义方欢王科崔添毓
申请(专利权)人:深圳吉因加医学检验实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1