一种甲基化测序数据过滤方法及应用技术

技术编号:33448420 阅读:31 留言:0更新日期:2022-05-19 00:33
本发明专利技术属于生物技术领域,具体涉及一种甲基化测序数据过滤方法及应用。本发明专利技术提供的甲基化测序数据过滤方法能够将亚硫酸氢盐处理过的DNA中,未发生甲基化的C碱基转化为U碱基的转化效率,从98.81%提高到99.44%。在此基础上,应用本申请的数据过滤方法可以准确评估序列的甲基化水平并获得质量过关、准确率和可信度高的甲基化单倍型。实验数据显示,使用通过本发明专利技术提供的甲基化测序数据过滤方法得到的甲基化单倍型,能够很好的区分膀胱尿路上皮癌患者与正常人的尿液样本(AUC=0.94)以及肌层浸润性膀胱尿路上皮癌与非肌层浸润性膀胱尿路上皮癌患者的尿液样本(AUC=0.967)。尿路上皮癌患者的尿液样本(AUC=0.967)。尿路上皮癌患者的尿液样本(AUC=0.967)。

【技术实现步骤摘要】
一种甲基化测序数据过滤方法及应用


[0001]本专利技术属于生物
,具体涉及一种甲基化测序数据过滤方法及应用。

技术介绍

[0002]DNA甲基化是一种重要的表观遗传修饰,它与许多生物调控途径相关,目前存在多种碱基层面分辨率的甲基化定量方法,本专利技术采用的是亚硫酸盐测序(Bisulfite sequencing,BS

seq,methseq)。
[0003]亚硫酸氢盐处理过的DNA中,未发生甲基化的C碱基会被转化为U碱基,且转化效率能达到99%左右,通过高通量测序方法可精确地测量单碱基水平的甲基化修饰。经过亚硫酸氢盐转化的DNA,通过PCR反应扩增后,U碱基转变成T,而甲基化的C保持不变,因此通过序列每个位置的碱基信息就能得到甲基化修饰的具体碱基位置。计算机软件确定测序仪测得的碱基及顺序,获得序列片段(read/fragment),输出FASTQ格式数据记录读段序列及测序质量分数。
[0004]在常规的分析中,亚硫酸氢盐测序数据可能出现的错误包含两种情况:(1)未甲基化的位点经过处理后,没有成功地将C本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于过滤甲基化测序数据的设备,其包括:处理器;用于存储执行指令的存储器;其中,所述处理器执行指令时,实现甲基化测序数据的过滤方法,所述方法包括下列步骤:i)截取引物合成时插入区域上的测序序列;ii)按以下条件过滤测序片段,以获得符合条件的测序片段的甲基化单倍型:a.去除C和G碱基转化频率都小于0.9的片段;b.去除C和G碱基转化频率都大于0.5的片段;c.去除被视为错误的序列;d.保留C碱基转化率小于0.2同时G碱基转化率大于0.8的测序片段;e.保留G碱基转化率小于0.2同时C碱基转化率大于0.8的测序片段;iii)提取测序深度大于10的单倍型;iiii)筛除C碱基的甲基化频率为空的单倍型。2.根据权利要求1所述的设备,其特征在于,所述甲基化测序数据通过亚硫酸氢盐测序得到。3.一种用于选取能够判断受试者是否患有癌症或者对于癌症患者进行分型的DNA甲基化单倍型的设备,其包括处理器;用于存储执行指令的存储器;其中,所述处理器执行指令时,实现选取能够判断受试者是否患有癌症或者对于癌症患者进行分型的DNA甲基化单倍型的方法,所述方法包括如下步骤:甲基化测序数据过滤步骤;甲基化差异单倍型选择步骤;甲基化差异单倍型训练步骤。4.根据权利要求3所述的设备,其特征在于,所述甲基化测序数据过滤步骤包括:i)截取引物合成时插入区域上的测序序列;ii)按以下条件过滤测序片段,以获得符合条件的测序片段的甲基化单倍型:a.去除C和G碱基转化频率都小于0.9的片段;b.去除C和G碱基转化频率都大于0.5的片段;c.去除被视为错误的序列;d.保留C碱基转化率小于0.2同时G碱基转化率大于0.8的测序片段;e.保留G碱基转化率小于0.2同时C碱基转化率大于0.8的测序片段;iii)提取测序深度大于10的单倍型;iiii)筛除C碱基的甲基化频率为空的单倍型。5.根据权利要求3所述的设备,其特征在于,所述...

【专利技术属性】
技术研发人员:张翼陈昕彤
申请(专利权)人:安康优乐复生科技有限责任公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1