差异羟甲基化位点的检测方法及装置制造方法及图纸

技术编号:38631438 阅读:14 留言:0更新日期:2023-08-31 18:30
本申请公开了一种差异羟甲基化位点的检测方法,该方法包括:根据候选羟甲基化区段,获取区段内各碱基位置测序深度分布的波峰和波谷信息;步骤2,根据所述波峰和波谷信息,对所述区段内各碱基位置测序深度分布进行拆分,缩小候选羟甲基化区段,并获取区段测序深度信息和区段位置信息;步骤3,根据所述区段测序深度信息和所述区段位置信息获取所述差异羟甲基化位点。化位点。化位点。

【技术实现步骤摘要】
差异羟甲基化位点的检测方法及装置


[0001]本申请涉及表观基因组学
,尤其是涉及到一种差异羟甲基化位点的检测方法及装置、存储介质、计算机设备。

技术介绍

[0002]随着对生命过程认识的不断加深,表观基因组学领域的研究热度更是逐年提升。DNA甲基化是最早被发现、同时也是研究最深入的表观遗传调控机制之一。在DNA去甲基化的过程中,羟甲基化是一个重要的节点,其有着非常广阔的研究前景。近年兴起的5hmC

Seal技术能够区分5mC和5hmC,特异性捕获并检测5hmC。然而,由于5hmC

Seal技术较新,因此与5hmC

Seal技术配套的现有分析方法均存在漏检、分辨率低等问题。
[0003]具体而言,DNA甲基化是DNA化学修饰的一种方式,通过在基因组CpG二核苷酸胞嘧啶的5号位碳原子上共价结合一个甲基基团,在不改变DNA碱基序列的情况下,引起染色质结构、DNA构象、DNA稳定性以及DNA与蛋白质相互作用方式的改变。而DNA羟甲基化是在DNA甲基化基础上将5

甲基胞嘧啶氧化成5

羟甲基化胞嘧啶,其中,5

羟甲基化胞嘧啶可能通过参与DNA去甲基化过程,可以参与调控基因表达。
[0004]目前常见检测DHMR的方法有基于模型的ChIP

Seq分析方法(MACS)和基于DNA甲基化免疫沉淀分析(MeDIPS)。在ChIP

Seq过程中,基因组会先被破碎成300~500的小片段,再用TF(转录因子)对这些小片段进行随机捕获,随后对沉淀下来的片段进行双端测序,获取reads。由于这里测得的reads只是跟随TF被一起沉淀下来的DNA碎片的末端,并非实际的TF结合位点,所以对于一个TF结合位点,reads将在TF结合位点附近的正负链上形成近似“双峰”的各碱基测序深度分布图。
[0005]基于模型的ChIP

Seq分析方法(MACS)最初用于处理ChIP

Seq数据,以寻找基因组上的TF结合位点。由于5hmC

Seal技术原理层面与ChIP

Seq有众多相似之处,因此MACS也可以被用来分析5hmC

Seal测序数据,从而确定DHMR位置。
[0006]此外,基于DNA甲基化免疫沉淀分析(MeDIPS)是通过5

甲基胞嘧啶(5mc)抗体富集高甲基化的DNA片段,并结合第二代高通量测序,对富集到的DNA片段进行测序,从而检测全基因组范围内的甲基化位点。由于5hmC

Seal测到的均是通过特异性捕获的羟甲基化DNA片段,因此区段内reads数直接反应了基因组上该位置羟甲基化程度的高低,通过比较两样本每个区段内reads数的相对高低,能够确定DHMR位置。
[0007]目前,关于DNA羟甲基化的研究还有很大的拓展空间,并且5hmC

Seal测序方法的出现为检测DNA羟甲基化位点提供了一个非常重要的技术手段。该方法通过特异性捕获发生羟甲基化的DNA片段,并对其进行测序,从而检测DNA羟甲基化区段。由于5hmC

Seal的技术特性,无法针对DNA羟甲基化给出一个单碱基分辨率的得分,仅能得知在某一区间内是否存在DNA羟甲基化事件。因而在数据分析时,就需要在保证准确性的同时,尽量缩短候选区间大小,但目前仍缺乏针对5hmC

Seal测序数据的高质量分析检测方法。

技术实现思路

[0008]有鉴于此,本申请提供了一种差异羟甲基化位点的检测方法及装置、存储介质、计算机设备。
[0009]根据本申请的一个方面,提供了一种差异羟甲基化位点的检测方法,其特征在于,包括:
[0010]步骤1,根据候选羟甲基化区段,获取区段内各碱基位置测序深度分布的波峰和波谷信息;
[0011]步骤2,根据所述波峰和波谷信息,对所述区段内各碱基位置测序深度分布进行拆分,缩小候选羟甲基化区段,并获取区段测序深度信息和区段位置信息;
[0012]步骤3,根据所述区段测序深度信息和所述区段位置信息获取所述差异羟甲基化位点。
[0013]可选地,所述步骤1,具体包括:
[0014]对5

羟甲基胞嘧啶测序结果进行分析,获取所述候选羟甲基化区段;
[0015]对所述区段内各碱基位置测序深度分布进行检测,获取所述区段内各碱基位置测序深度分布的波峰和波谷信息。
[0016]可选地,所述步骤3,具体包括:
[0017]对获取的所述区段测序深度信息进行正态性检验,保留检验通过区段;
[0018]对所述检验通过区段进行分析,获取所述羟甲基化位点;
[0019]将拆分得到的全部所述区段位置信息进行整合并构建中间文件,统计所述区段的计数信息;
[0020]对所述计数信息进行差异分析,确定所述羟甲基化位点中的差异羟甲基化位点。
[0021]可选地,所述对所述计数信息进行差异分析,确定所述羟甲基化位点中的差异羟甲基化位点之后,还包括:
[0022]将所述差异羟甲基化位点分为上调结果和下调结果,并根据所述上调结果和所述下调结果对所述差异羟甲基化位点进行分类。
[0023]根据本申请的另一方面,提供了一种羟甲基化位点的检测装置,包括:
[0024]候选羟甲基化区段产出模块,用于获取区段内各碱基位置测序深度分布的波峰和波谷信息;
[0025]信息获取模块,用于根据所述波峰和波谷信息,对所述区段内各碱基位置测序深度分布进行拆分,缩小候选羟甲基化区段,并获取区段测序深度信息和区段位置信息;
[0026]差异羟甲基化位点获取模块,用于根据所述区段测序深度信息和所述区段位置信息获取所述差异羟甲基化位点。
[0027]可选地,所述候选羟甲基化区段产出模块,具体用于对5

羟甲基胞嘧啶测序结果进行分析,获取所述候选羟甲基化区段;以及对所述区段内各碱基位置测序深度分布进行检测,获取所述区段内各碱基位置测序深度分布的波峰和波谷信息。
[0028]可选地,差异羟甲基化位点获取模块,具体用于对获取的所述区段测序深度信息进行正态性检验,保留检验通过区段;对所述检验通过区段进行分析,获取所述羟甲基化位点;将拆分得到的全部所述区段位置信息进行整合并构建中间文件,统计所述区段的计数信息;以及对所述计数信息进行差异分析,确定所述羟甲基化位点中的差异羟甲基化位点。
[0029]可选地,所述装置还包括:
[0030]分类模块,用于将所述差异羟甲基化位点分为上调结果和下调结果,并根据所述上调结果和所述下调结果对所述差异羟甲基化位点进行分类。
[0031]依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述差异本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种差异羟甲基化位点的检测方法,其特征在于,包括:步骤1,根据候选羟甲基化区段,获取区段内各碱基位置测序深度分布的波峰和波谷信息;步骤2,根据所述波峰和波谷信息,对所述区段内各碱基位置测序深度分布进行拆分,缩小候选羟甲基化区段,并获取区段测序深度信息和区段位置信息;步骤3,根据所述区段测序深度信息和所述区段位置信息获取所述差异羟甲基化位点。2.根据权利要求1所述的方法,其特征在于,所述步骤1,具体包括:对5

羟甲基胞嘧啶测序结果进行分析,获取所述候选羟甲基化区段;对所述区段内各碱基位置测序深度分布进行检测,获取所述区段内各碱基位置测序深度分布的波峰和波谷信息。3.根据权利要求2所述的方法,其特征在于,所述步骤3,具体包括:对获取的所述区段测序深度信息进行正态性检验,保留检验通过区段;对所述检验通过区段进行分析,获取所述羟甲基化位点;将拆分得到的全部所述区段位置信息进行整合并构建中间文件,统计所述区段的计数信息;对所述计数信息进行差异分析,确定所述羟甲基化位点中的差异羟甲基化位点。4.根据权利要求3所述的方法,其特征在于,所述对所述计数信息进行差异分析,确定所述羟甲基化位点中的差异羟甲基化位点之后,还包括:将所述差异羟甲基化位点分为上调结果和下调结果,并根据所述上调结果和所述下调结果对所述差异羟甲基化位点进行分类。5.一种羟甲基化位点的检测装置,其特征在于,包括:候选羟甲基化区段产出模块,用于获取区段内各碱基位置测序深度分布的波峰和波谷信息;信息获取模块,用于根据所述波峰和...

【专利技术属性】
技术研发人员:时晰陈伟郭维维
申请(专利权)人:北京京安长德数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1