筛选大片段甲基化标志物的系统及其方法技术方案

技术编号:39398521 阅读:26 留言:0更新日期:2023-11-19 15:52
本申请公开了一种筛选大片段甲基化标志物的方法和系统,所述方法包括:对样本进行全基因组测序,得到样本的第一全基因组序列集;将所述第一全基因组序列集与参考基因组进行比对以得到第二全基因组序列集;对所述第二全基因组序列集进行识别以得到第二全基因组序列集上的全部甲基化修饰信息;对所述第二全基因组序列集进行分割并统计分割后每个分割区域的第一特征值和第三特征值;基于所述第一特征值和第三特征值从分割后的分割区域中筛选出大片段甲基化标志物,采用上述所述的方法得到的大片段甲基化标志物,其能够刻画

【技术实现步骤摘要】
筛选大片段甲基化标志物的系统及其方法


[0001]本申请涉及生物
,尤其涉及一种筛选大片段甲基化标志物的系统及其方法


技术介绍

[0002]DNA(
主要是
CpG

)
甲基化是其遗传机制和表型效应最为明确的表观遗传性机制
。DNA
甲基化谱式的变化不仅指导在正常发育过程中细胞谱系特化所依据的基因组转录谱式的改变,且在疾病发生和发展的基因表达异化中起着决定性的作用
。DNA
是远比
RNA、
蛋白和小分子代谢物稳定的生物标志物,其所携带的遗传
(
突变,融合和拷贝数变异
)

DNA
甲基化状态的信息在疾病的诊治方面有着更好的前景

[0003]在世界范围内,癌症和其他慢病
(
卒中

心血管疾病等
)
的发病率

死亡率居首位

一些常规的筛查癌症手段,如低剂量螺
CT(L本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种筛选大片段甲基化标志物的方法,其包括:对样本进行全基因组测序,得到样本的第一全基因组序列集;将所述第一全基因组序列集与参考基因组进行比对以得到第二全基因组序列集;对所述第二全基因组序列集进行识别以得到第二全基因组序列集上的全部甲基化修饰信息;对所述第二全基因组序列集进行分割并统计分割后每个分割区域的第一特征值和第三特征值;基于所述第一特征值和第三特征值从分割后的分割区域中筛选出大片段甲基化标志物
。2.
根据权利要求1所述的方法,其中,基于所述第一特征值和第三特征值从分割后的分割区域中筛选出大片段甲基化标志物包括如下步骤:基于第三特征值计算第二特征值并通过第一特征值和第二特征值来筛选出大片段甲基化标志物
。3.
根据权利要求1或2中任一项所述的方法,其中,所述第一特征值为分割后每个分割区域的平均
CG
位点深度;所述第三特征值是分割后每个分割区域的平均甲基化中位数水平
。4.
根据权利要求2或3所述的方法,其中,所述第二特征值为不同样品分组中任意两个分割后分割区域的平均甲基化中位数水平之间的差值,即平均差异甲基化中位数水平;优选地,通过第一特征值和第二特征值来筛选出大片段甲基化标志物是指当所述任意分割后分割区域的第一特征值大于3且所述分割区域与在不同样本分组中任意一个分割区域的第三特征值之间的差值大于
0.1
时的所述分割区域中筛选出的大片段甲基化标志物,即所述第一特征值>3且第二特征值>
0.1。5.
根据权利要求3‑4中任一项所述的方法,其中,每个分割区域的平均甲基化中位数水平通过以
5kb
为一个分割区域所得到的平均甲基化中位数水平;优选地,所述平均甲基化中位数水平指的是分割区域中所述
CG
位点的甲基化胞嘧啶的深度的总和与所有
CG
位点的总深度之和的比值;优选地,所述平均
CG
位点深度指的是分割区域中甲基化的胞嘧啶的
reads
的个数
。6.
一种筛选大片段甲基化标志物的系统,其包含:获取第一全基因组序列集单元,...

【专利技术属性】
技术研发人员:田继超杨亚东李永君彭勇飞郭媛媛刘栓平
申请(专利权)人:博尔诚北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1