一种具有单碱基分辨率的检测DNA甲基化和单核苷酸变异的测序文库及应用制造技术

技术编号:19712456 阅读:18 留言:0更新日期:2018-12-08 18:23
本发明专利技术提供了一种发夹状的接头以及利用所述发夹状接头同时检测DNA甲基化和单核苷酸变异的方法,属于基因变异检测和表观遗传修饰检测技术领域;所述接头具有如SEQ ID No.1所示的核苷酸序列,所述发夹状接头的5’至3’方向3位和4位上的胞嘧啶是甲基化修饰的胞嘧啶。所述方法包括以下步骤:基因组DNA片段化后进行末端修复加A尾,连接所述的发夹状接头和甲基化测序接头,重亚硫酸盐转化,PCR扩增,收集扩增产物获得测序文库;测序后进行生物信息学分析获得DNA甲基化和单核苷酸变异位点,本方法可以在只测一套数据的情况下同时精确检测DNA甲基化和单核苷酸变异,可以节省50%的成本。

【技术实现步骤摘要】
一种具有单碱基分辨率的检测DNA甲基化和单核苷酸变异的测序文库及应用
本专利技术属于基因变异检测和表观遗传修饰检测
,尤其涉及一种具有单碱基分辨率的同时检测DNA甲基化和单核苷酸变异的方法。
技术介绍
胞嘧啶甲基化是基因组DNA上丰度最高、研究最广泛的表观遗传修饰,其在很多生物学过程中发挥了重要的作用,包括胚胎发育、X染色体沉默、基因印记和转座元件沉默等。胞嘧啶甲基化的紊乱在癌症、免疫缺陷等众多疾病的发生和发展过程中发生。目前,全基因组范围、单碱基分辨率的DNA甲基化检测主要通过重亚硫酸盐处理结合高通量测序实现,在此过程中未甲基化的胞嘧啶被转化为尿嘧啶,随后在扩增时被胸腺嘧啶取代,而甲基化胞嘧啶则不发生转化。从重亚硫酸盐测序数据中鉴定单核苷酸变异对于准确定量DNA的甲基化水平尤为重要,尤其是因为C>T突变是人群中最广泛的变异(dbSNP数据库中65%的的SNP是C>T),并且经常发生在CpG上。鉴定单核苷酸变异对于检测等位基因特异的DNA甲基化位点和印记基因也有重要意义。同时检测胞嘧啶甲基化和单核苷酸变异一直备受关注,针对这一课题,目前已有多款软件用来从MethylC-seq数据中检测单核苷酸变异。这些软件的共同原理都是基于未甲基化的胞嘧啶在重亚硫酸盐处理时被转化为尿嘧啶,而与胞嘧啶互补配对的鸟嘌呤不发生变化。尽管目前已有多款软件用来从MethylC-seq数据中检测单核苷酸变异,但是由于MethylC-seq文库本身的缺陷,软件的灵敏性和准确性都较低。主要是因为在MethylC-seq文库构建过程中,经过重亚硫酸盐处理后DNA的双链会分开,因此在后面测序的时候可能只测到其中一条链,造成无法判断该位置是未甲基化的胞嘧啶还是胞嘧啶>胸腺嘧啶的单碱基突变。另外,由于在重亚硫酸盐处理过程中,绝大多数胞嘧啶未发生甲基化而被转化成尿嘧啶,因此重亚硫酸盐转化后的基因组碱基和序列复杂度降低,这导致了后续生物信息分析过程中比对错误率极高。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种具有单碱基分辨率的同时检测DNA甲基化和单核苷酸变异的方法,所述方法灵敏度和准确度高。为了实现上述专利技术目的,本专利技术提供以下技术方案:一种发夹状的接头,所述发夹状接头具有如SEQIDNo.1所示的核苷酸序列,所述发夹状接头的5’至3’方向3位和4位上的胞嘧啶是甲基化修饰的胞嘧啶。本专利技术还提供了一种具有单碱基分辨率的同时检测基因组DNA甲基化和单核苷酸变异测序文库的构建方法,包括以下步骤:1)将基因组DNA进行片段化获得DNA片段;2)将步骤1)中获得的DNA片段进行末端修复加A尾后,同时连接发夹状接头和甲基化测序接头,获得待转化的DNA片段;3)将所述待转化的DNA片段重亚硫酸盐转化后,进行PCR扩增,切胶纯化扩增产物获得测序文库。优选的,所述DNA片段的长度为150~200bp。优选的,步骤2)中所述末端修复加A尾的体系中包括DNA片段、末端修复加A缓冲液和末端修复加A缓冲液混合酶。优选的,所述末端修复加A尾的程序为20℃,30min,65℃,30min。优选的,步骤3)中构建获得的测序文库的片段大小为400~800bp。本专利技术还提供了一种具有单碱基分辨率的同时检测DNA甲基化和单核苷酸变异的方法,包括以下步骤1)将所述构建方法获得的测序文库进行双端测序,获得双端测序数据;2)去除所述双端测序数据中的接头、测序引物和低质量数据,获得干净的双端测序数据;3)将所述干净的双端数据与参考基因组数据进行比对,根据干净的双端测序数据的比对位置的一致性,筛选获得基因组DNA甲基化位点和单核苷酸变异位点。优选的,步骤3)中所述比对后还包括去除重复序列和序列重排。优选的,步骤3)中所述筛选的参数要求如下:配对的read间比对到参考基因组上起始位置差值≤100bp;每条read长度为50~200bp,每条read中出现N的个数小于4;read中每一碱基的最小质量值为20;每条read中所有碱基的质量值小于最小质量值的个数之和与read长度的比例最小值为0.6;配对read出现测序错误的个数≤10;配对read检测到的snp的个数≤5;配对read检测到的InDel的个数≤1;read中每50bp出现的单核苷酸变异≤3;等位基因频率为0.1~0.15。优选的,步骤3)中所述筛选甲基化位点,当测定read1和read2同一位点均为C时,正义链为甲基化的C;当测定read1和read2同一位点均为G时,反义链为甲基化的C。本专利技术提供的一种甲基化的发夹状接头,可以将双链DNA的两条链连接在一起。将3’端加“A”尾的双链DNA一端连上所述甲基化的发夹状接头,能够确保DNA片段重亚硫酸盐处理后,DNA的两条链的氢键结构虽然被打开,但是仍然可以通过发夹状接头连接在一起。利用本专利技术所述的甲基化的发夹状接头,构建的测序文库,连接了发夹状接头的DNA经过重亚硫酸盐转化后双链序列会在同一条文库DNA上,因此在进行高通量测序时,重亚硫酸盐转化的DNA的双链可以同时被检测到。基于双端测序数据的比对位置的一致性,对比对到基因组上的数据进行筛选,得到更加严谨的比对结果,有效排除比对错误。在进行单核苷酸变异的分析时,同时考虑测序的两条链,可以校正测序错误和扩增错误,准确鉴定出C>T的变异,显著降低SNV检测的假阳性率。本专利技术提供的一种单碱基分辨率的同时精确检测DNA甲基化和单核苷酸变异的方法,可以同时精确检测基因组DNA上的甲基化和单核苷酸变异相较于传统的分别进行全基因组重测序和全基因组重亚硫酸盐测序检测DNA甲基化和单核苷酸变异的方法,本方法可以在只测一套数据的情况下同时精确检测DNA甲基化和单核苷酸变异,可以节省50%的成本。进一步的,本专利技术中所述的方法中筛选的参数要求同时也可以鉴定DNA半甲基化位点和印记基因。附图说明图1为本专利技术同时检测DNA甲基化和单核苷酸变异测序文库的构建流程;图2为本专利技术获得测序数据后进行生物信息学分析流程图;图3为配对read间比对到参考基因组上起始位置差值示意图;图4为50bp范围内筛选连续突变最大个数示意图;图5为DSBS检测出的SNV与WGS检测出的SNV的韦恩图;图6本专利技术中的方法与methyl-C测序检测DNA甲基化水平比较图。具体实施方式本专利技术提供了一种发夹状的接头,所述接头具有如SEQIDNo.1所示的核苷酸序列,所述发夹状接头的5’至3’方向3位和4位上的胞嘧啶是甲基化修饰的胞嘧啶;具体序列如下:5’-pho-cgmcmcaggtggcaagtgaagccacctggcgt-3’。将3’端加“A”尾的双链DNA一端连上所述甲基化的发夹状接头,能够确保DNA片段重亚硫酸盐处理后,DNA的两条链的氢键结构虽然被打开,但是仍然可以通过发夹状接头连接在一起。本专利技术还提供了一种具有单碱基分辨率的同时检测DNA甲基化和单核苷酸变异测序文库的构建方法,包括以下步骤:1)将基因组DNA进行片段化获得DNA片段;2)将步骤1)中获得的DNA片段进行末端修复加A尾后,同时连接发夹状接头和甲基化测序接头,获得待转化的DNA片段;3)将所述待转化的DNA片段重亚硫酸盐转化后,进行PCR扩增,切本文档来自技高网
...

【技术保护点】
1.一种发夹状的接头,其特征在于,所述发夹状接头具有如SEQ ID No.1所示的核苷酸序列,所述发夹状接头的5’至3’方向3位和4位上的胞嘧啶是甲基化修饰的胞嘧啶。

【技术特征摘要】
1.一种发夹状的接头,其特征在于,所述发夹状接头具有如SEQIDNo.1所示的核苷酸序列,所述发夹状接头的5’至3’方向3位和4位上的胞嘧啶是甲基化修饰的胞嘧啶。2.一种具有单碱基分辨率的同时检测基因组DNA甲基化和单核苷酸变异测序文库的构建方法,包括以下步骤:1)将基因组DNA进行片段化获得DNA片段;2)将步骤1)中获得的DNA片段进行末端修复加A尾后,同时连接权利要求1所述的发夹状接头和甲基化测序接头,获得待转化的DNA片段;3)将所述待转化的DNA片段重亚硫酸盐转化后,进行PCR扩增,收集扩增产物,获得测序文库。3.根据权利要求2所述测序文库的构建方法,其特征在于,所述DNA片段的长度为150~200bp。4.根据权利要求2所述测序文库的构建方法,其特征在于,步骤2)中所述末端修复加A尾的体系中包括DNA片段、末端修复加A缓冲液和末端修复加A缓冲液混合酶。5.根据权利要求4所述测序文库的构建方法,其特征在于,所述末端修复加A尾的程序为20℃,30min,65℃,30min。6.根据权利要求2所述测序文库的构建方法,其特征在于,步骤3)中构建获得的测序文库的片段大小为400~800bp。7.一种具有单碱基分辨率的同时检测DNA甲基化和单核苷酸变异的方法,包括以下步骤:1)将权利要求2~6任意一项所述构建方法获得的测序文库进行双端测...

【专利技术属性】
技术研发人员:梁加龙张坤腾花景孙中生
申请(专利权)人:中国科学院动物研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1