本发明专利技术涉及甲基化测序数据分析方法。具体而言,本发明专利技术通过对囊胚培养液中存在的游离DNA进行甲基化测序,并筛选获取测序数据中CpG位点平均甲基化水平为0~0.7的读段,可较大程度地降低来自母体(例如母源DNA)的甲基化测序数据对囊胚的甲基化测序数据的干扰。数据对囊胚的甲基化测序数据的干扰。数据对囊胚的甲基化测序数据的干扰。
【技术实现步骤摘要】
甲基化测序数据分析方法
[0001]本专利技术涉及测序数据分析领域,具体涉及对含胚胎游离DNA(embryonic cell
‑
free DNA)的生物样品的甲基化测序数据进行分析的方法。具体而言,本专利技术利用生物信息学手段对囊胚培养液全基因组甲基化测序数据进行处理,特别地,通过筛选获取平均甲基化水平在一定范围的读段,从而较大程度地降低了来自母体(例如母源DNA)的甲基化测序数据对囊胚的甲基化测序数据的干扰。
技术介绍
[0002]目前,PGT
‑
A的主要流程包括分离1个或者多个胚胎细胞去评估23对染色体及亚染色体区的拷贝数,其中主要用到的胚胎细胞材料有3种,第一种是分离极体细胞去检测,这种方法因为缺乏父源基因组不能准确检测受精后的胚胎的问题,并且因为极体极易降解,所以临床上应用较少。第二种方法是分离卵裂球中的一个细胞去检测。这种方法会影响胚胎发育,而且会降低着床潜能,同时因为只获得1个细胞去检测,会存在嵌合(一个胚胎中存在多种拷贝数情况)引起的误诊,目前临床上这种方法也不常用。第三种是分离滋养外胚层中5
‑
10个细胞活检,这种TE活检方法是目前临床上的常规检测方法。但是据文献报道,这种活检方法对胚胎和母体有危害,且对子代长期的安全性还没有充分评估,同时也存在嵌合风险。以上所有方法,都对胚胎进行了有创的操作,存在很多弊端。
[0003]2013年意大利的科学家发现体外培养的囊胚培养液中存在游离DNA,这一发现为无创植入前遗传检测带来了希望。2016年谢晓亮教授等人开发了一种新型的单细胞全基因组扩增方法,将培养液中微量的DNA进行了全基因组测序并计算了染色体的拷贝数,发现由培养液得到的拷贝数和用全胚胎得到的拷贝数一致率超过85%。并且由培养液结果指导移植的胚胎,最终活产率超过70%。2017年有文章报道,培养液中存在母源颗粒细胞的污染。颗粒细胞的污染对染色体拷贝数的评估具有致命性影响。因为颗粒细胞是2倍体,如果胚胎存在拷贝数异常,就会掩盖异常的拷贝数出现整倍体的检测结果。
[0004]本专利技术提供了对囊胚培养液的甲基化测序数据进行分析的方法,该方法可较大程度地降低来自母体(例如母源DNA)的甲基化测序数据对囊胚的甲基化测序数据的干扰,从而较为准确地反映囊胚的DNA甲基化情况。
技术实现思路
[0005]研究发现,通过对囊胚培养液中存在的游离DNA进行甲基化测序,并筛选获取测序数据中CpG位点平均甲基化水平为0~0.7的读段,可较大程度地降低来自母体(例如母源DNA)的甲基化测序数据对囊胚的甲基化测序数据的干扰。
[0006]因此,在一个方面,本申请提供一种分析含胚胎游离DNA的生物样品的甲基化测序数据的方法,其包括以下步骤:
[0007]提供所述甲基化测序数据;
[0008]筛选获取所述甲基化测序数据中CpG位点的平均甲基化水平为0~0.7的读段
(reads)。
[0009]所述CpG位点的甲基化水平是指含有CpG位点甲基化胞嘧啶的读段数量与读段总数的比值。例如,CpG位点甲基化水平为0的读段是指所述读段中含1个或多个CpG位点,但所有CpG位点均未发生甲基化。需要特别明确的是,此处所述CpG位点特指未经化学或酶促转化等手段进行甲基化测序的DNA中的CpG位点,该位点在测序数据中可能因甲基化测序手段不同而有不同表现形式。
[0010]在一些实施方案中,所述甲基化测序数据由多个读段组成。
[0011]一般而言,可通过对所述生物样品进行甲基化测序获得所述甲基化测序数据。易于理解,本专利技术的方法不受限于具体的甲基化测序方法。因此,可以使用各种甲基化测序方法以获得本文所述的甲基化测序数据。在一些实施方案中,可使用全基因组甲基化测序法、靶向甲基化测序法、基于第三代单分子
‑
长读长甲基化测序方法、酶学转化法甲基化测序法(Enzymatic Methyl
‑
seq,EM
‑
seq)、TET辅助的吡啶硼烷测序法(TET
‑
assisted pyridine borane sequencing,TAPS)对所述生物样品进行甲基化测序(A new sequencing method to detect DNA modifications of relevance to cancer,Chunxiao Song,et al.Ludiwig institute for cancer research.Feb.25,2019;Bisulfite
‑
freedirect detection of 5
‑
methylcytosine and 5
‑
hydroxymethylcytosine at base resolution,Yibin Liu,et al.Nature Biotechnology,volume 37,pages 424
–
429(2019))。
[0012]所述全基因组甲基化测序是单细胞全基因组甲基化测序技术。此类技术是本领域技术人员熟知的,参见例如Stuart T,Satija R.Integrative single
‑
cell analysis.Nat Rev Genet.2019May;20(5):257
‑
272。在一些实施方案中,所述单细胞全基因组甲基化测序技术选自scBS
‑
seq(single
‑
cell bisulfite sequencing,单细胞重亚硫酸盐测序)(参见例如Smallwood,S.A.et al.Single
‑
cell genome
‑
wide bisulfite sequencing for assessing epigenetic heterogeneity.Nat.Methods 11,817
‑
820(2014))、snmC
‑
seq(single
‑
nucleus methylcytosine sequencing,单细胞核甲基胞嘧啶测序)(参见例如Luo,C.et al.Single
‑
cell methylomes identify neuronal subtypes and regulatory elements in mammalian cortex.Science 357,600
–
604(2017))、sci
‑
MET(single
‑
cell combinatorial indexing for methylation analysis,单细胞组合标记甲基化检测)(参见例如Mulqueen,R.M.et al.Highly scalable generation of DNA methy本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种分析含胚胎游离DNA(embryonic cell
‑
free DNA)的生物样品的甲基化测序数据的方法,其包括以下步骤:提供所述甲基化测序数据;筛选获取所述甲基化测序数据中CpG位点平均甲基化水平为0~0.7的读段(reads)。2.一种计算机可读介质,其用多个控制计算系统的指令编码,以便对含胚胎游离DNA的生物样品的甲基化测序数据进行分析,其中所述指令被执行时实现下述步骤:接收所述生物样品的甲基化测序数据;筛选获取所述数据中CpG位点平均甲基化水平为0~0.7的读段。3.分析含胚胎游离DNA的生物样品的方法,其包括以下步骤:提供所述生物样品;对所述生物样品进行甲基化测序,获得所述生物样品的甲基化测序数据;筛选获取所述甲基化测序数据中CpG位点平均甲基化水平为0~0.7的读段;对筛选得到的数据进一步处理,获得所关注的染色体、亚染色体和/或基因组上局部区域的拷贝数变异。4.一种计算机可读介质,其用多个控制计算系统的指令编码,以便对含胚胎游离DNA的生物样品进行分析,其中所述指令被执行时实现下述步骤:接收所述生物样品甲基化测序数据;筛选获取所述数据中CpG位点平均甲基化水平为0~0.7的读段;处理上述筛选得到的数据,获得所关注的染色体、亚染色体和/或基因组上局部区域的拷贝数;基于所关注的染色体、亚染色体和/或基因组上局部区域的拷贝数诊断染色体非整倍体性或其嵌合程度、或亚染色体区或基因组上局部区域的拷贝数变异。5.权利要求1
‑
4任一项所述的方法或计算机可读介质,其中筛选获取甲基化测序数据中CpG位点平均甲基化水平为0、0.1以下...
【专利技术属性】
技术研发人员:文路,黄锦,汤富酬,乔杰,陈依东,高原,
申请(专利权)人:北京大学第三医院北京大学第三临床医学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。