测定核酸的碱基修饰制造技术

技术编号:39054120 阅读:18 留言:0更新日期:2023-10-12 19:47
本文描述了利用碱基修饰的测定来分析核酸分子和获取核酸分子分析数据的系统和方法。碱基修饰可以包含甲基化。用于测定碱基修饰的方法可以包含使用来源于测序的特征。这些特征可以包含来自测序碱基的光信号的脉冲宽度、碱基的脉冲间持续时间以及碱基的组成。可以对机器学习模型进行训练以使用这些特征来检测所述碱基修饰。单倍型之间的相对修饰或甲基化水平可以指示病症。修饰或甲基化状态还可以用于检测嵌合分子。检测嵌合分子。

【技术实现步骤摘要】
测定核酸的碱基修饰
[0001]相关申请的交叉引用
[0002]本申请是申请号为202080004977.4的中国专利申请的分案申请,并且要求以下临时申请的优先权益:2020年7月13日提交的名称为“测定核酸的碱基修饰(DETERMINATION OF BASE MODIFICATIONS OF NUCLEIC ACIDS)”的美国临时申请第63/051,210号;2020年5月4日提交的名称为“测定核酸的碱基修饰(DETERMINATION OF BASE MODIFICATIONS OF NUCLEIC ACIDS)”的美国临时申请号第63/019,790号;2020年3月19日提交的名称为“测定核酸的碱基修饰(DETERMINATION OF BASE MODIFICATIONS OF NUCLEIC ACIDS)”的美国临时申请第62/991,891号;2020年2月5日提交的名称为“测定核酸的碱基修饰(DETERMINATION OF BASE MODIFICATIONS OF NUCLEIC ACIDS)”的美国临时申请第62/970,586号;2019年8月16日提交的名称为“测定核酸的碱基修饰(DETERMINATION OF BASE MODIFICATIONS OF NUCLEIC ACIDS)”的美国临时申请第62/887,987号,所有这些美国临时申请的全部内容通过引用并入本文用于所有目的。

技术介绍

[0003]核酸中碱基修饰的存在因不同的生物体而异,所述生物体包含病毒、细菌、植物、真菌、线虫、昆虫和脊椎动物(例如人)等。最常见的碱基修饰是在不同位置处向不同DNA碱基添加甲基,即所谓的甲基化。已经在胞嘧啶、腺嘌呤、胸腺嘧啶和鸟嘌呤上找到甲基化,如5mC(5

甲基胞嘧啶)、4mC(N4

甲基胞嘧啶)、5hmC(5

羟甲基胞嘧啶)、5fC(5

甲酰基胞嘧啶)、5caC(5

羧基胞嘧啶)、1mA(N1

甲基腺嘌呤)、3mA(N3

甲基腺嘌呤)、7mA(N7

甲基腺嘌呤)、3mC(N3

甲基胞嘧啶)、2mG(N2

甲基鸟嘌呤)、6mG(O6

甲基鸟嘌呤)、7mG(N7

甲基鸟嘌呤)、3mT(N3

甲基胸腺嘧啶)和4mT(O4

甲基胸腺嘧啶)。在脊椎动物基因组中,5mC是最常见的碱基甲基化类型在其之后是鸟嘌呤(即形成CpG的形式)。
[0004]DNA甲基化对哺乳动物的发育至关重要,并且在基因表达和沉默、胚胎发育、转录、染色质结构、X染色体失活、防止重复元件的活性、在有丝分裂期间维持基因组稳定性以及调节亲源基因组印记方面具有显著作用。
[0005]DNA甲基化以协同的方式在启动子和增强子的沉默中发挥着许多重要的作用(Robertson,2005;Smith和Meissner,2013)。已经发现许多人类疾病与DNA甲基化的异常相关,包含但不限于致癌过程、印记基因失调性疾病(例如,贝克威思

威德曼综合征(Beckwith

Wiedemann syndrome)和普拉德

威利综合征(Prader

Willi syndrome))、重复元件不稳定相关的疾病(例如,脆性X综合征)、自身免疫性疾病(例如,全身性红斑狼疮)、代谢障碍(例如,I型和II型糖尿病)、神经障碍、衰老等。
[0006]对DNA分子进行甲基化组修饰的精确测量将具有许多临床意义。一种广泛使用的测量DNA甲基化的方法是通过使用亚硫酸氢盐测序(BS

seq)(Lister等人,2009;Frommer等人,1992)。在此方法中,首先用亚硫酸氢盐处理DNA样本,非甲基化胞嘧啶(即C)转化为尿嘧啶,而甲基化的胞嘧啶保持不变。然后通过DNA测序分析经亚硫酸氢盐修饰的DNA。在另一种方法中,在亚硫酸氢盐转化之后,然后使用能够区分不同甲基化谱的亚硫酸氢盐转化的DNA
的引物对经过修饰的DNA进行聚合酶链式反应(PCR)扩增(Herman等人,1996)。后一种方法被称为甲基化特异性PCR。
[0007]此类基于亚硫酸氢盐的方法的一个缺点是,已经报道了亚硫酸氢盐转化步骤会使大多数经过处理的DNA显著降解(Grunau,2001)。另一个缺点是亚硫酸氢盐转化步骤将产生强烈的CG偏差(Olova等人,2018年),从而导致通常具有非均质甲基化状态的DNA混合物的信噪比降低。此外,由于在亚硫酸氢盐处理期间DNA的降解,亚硫酸氢盐测序将不能对长DNA分子进行测序。因此,需要测定核酸碱基的修饰,而无需事先进行化学反应(例如,亚硫酸氢盐转化)和核酸扩增(例如,使用PCR)。

技术实现思路

[0008]已经开发了一种新方法,在一个实施例中,所述新方法使得能够测定核酸中的碱基修饰(如5mC)而无需模板DNA预处理(如酶和/或化学转化,或蛋白质和/或抗体结合)。尽管此类模板DNA预处理对于所述碱基修饰的测定不是必需的,但在所示出的实例中,某些预处理(例如,用限制酶消化)可能有助于增强本专利技术的各方面(例如,允许富集CpG位点以供分析)。本公开中呈现的实施例可以用于检测不同类型的碱基修饰,例如,包含但不限于4mC、5hmC、5fC和5caC、1mA、3mA、7mA、3mC、2mG、6mG、7mG、3mT和4mT等。此类实施例可以利用

在测序过程中所产生的特征,例如受各种碱基修饰影响的动力学特征,以及测定甲基化状态的靶位置周围的窗口中的核苷酸的一致性。
[0009]本专利技术的实施例可以用于但不限于单分子测序。一种类型的单分子测序是单分子实时测序,其中对单个DNA分子测序的进度进行实时监测。一种类型的单分子实时测序是由太平洋生物科学公司(Pacific Biosciences)使用其单分子实时(SMRT)系统进行商业化的测序。方法可以使用来自测序碱基的信号的脉冲宽度、碱基的脉冲间持续时间(IPD)和碱基的一致性,以便检测碱基或相邻碱基中的修饰。另一个单分子系统是基于纳米孔测序的系统。纳米孔测序系统的一个实例是由牛津纳米孔技术公司(Oxford Nanopore Technologies)进行商业化的系统。
[0010]已经开发的方法可以作为检测生物样本中的碱基修饰以出于各种目的(包含但不限于研究和诊断目的)评估所述样本中的甲基化谱的工具。检测到的甲基化谱可以用于不同的分析。甲基化谱可以用于检测DNA的组织来源(例如,母亲或胎儿、器官、细菌或从癌症患者血液中富集的肿瘤细胞中获得的DNA)。对组织中异常甲基化谱的检测有助于鉴定个体的发育障碍,鉴定和预测肿瘤或恶性肿瘤。
[0011]本专利技术的实施例可以包含分析生物体的单倍型的相对甲基化水平。两种单倍型之间甲基化本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.用于确定多个样本核酸分子的组织类型的方法,其中所述多个样本核酸分子从生物组织样本获得,所述方法包括:对于所述多个样本核酸分子中的每个样本核酸分子:(a)接收通过测量对应于所述样本核酸分子中测序的核苷酸的光信号脉冲而获得的数据,并从所述数据获得以下性质的值:对于每个核苷酸:所述核苷酸的一致性,所述核苷酸在所述样本核酸分子中的位置,对应于所述核苷酸的所述脉冲的宽度,以及脉冲间持续时间,其表示对应于所述核苷酸的所述脉冲与对应于相邻核苷酸的脉冲之间的时间;(b)对于在所述样本核酸分子中测序的核苷酸的一个或多个核苷酸中的每一个,创建输入数据结构,所述输入数据结构包括在所述样本核酸分子中测序的核苷酸的窗口,其中所述窗口包括至少两个核苷酸,并且其中对于所述窗口内的每个核苷酸,所述输入数据结构包括以下性质:所述核苷酸的一致性,所述核苷酸相对于所述窗口内的靶位置的位置,对应于所述核苷酸的所述脉冲的宽度,以及脉冲间持续时间;(c)对于所述样本核酸分子中测序的核苷酸的一个或多个核苷酸中的每一个,将输入数据结构输入到模型中,所述模型被配置为:接收所述输入数据结构,所述输入数据结构使用通过测量对应于所述核苷酸的光信号脉冲而获得的数据来生成,将所述模型的优化参数应用于所述输入数据结构的性质;和输出甲基化状态,所述甲基化状态指定在相应窗口中的靶位置处的核苷酸是否具有甲基化;和(d)对于所述样本核酸分子中测序的核苷酸中的一个或多个核苷酸中的每一个,使用所述模型确定当核苷酸在输入数据结构中的窗口内的靶位置时核苷酸中是否存在甲基化的甲基化状态;使用所述多个样本核酸分子中的每个样本核酸分子的所述一个或多个核苷酸的甲基化状态来确定所述生物组织样本的甲基化水平;将所述甲基化水平与参考甲基化水平进行比较;和使用所述比较确定所述生物组织样本的组织类型。2.根据权利要求1所述的方法,其中所述组织类型是中性粒细胞、T细胞、B细胞、肝、肺、结肠、心脏、脑或胎盘。3.根据权利要求1所述的方法,其中所述组织类型是肿瘤组织或非肿瘤组织。4.根据权利要求1所述的方法,其中确定所述生物组织样本的组织类型包括:确定所述甲基化水平低于参考甲基化水平;和确定组织类型是肿瘤组织。
5.根据权利要求1

4中任一项所述的方法,其中所述参考甲基化水平是在全基因组水平上从来自参考组织类型的一种或多种参考核酸分子确定的。6.根据权利要求1

4中任一项所述的方法,其中所述参考甲基化水平是从来自与所述生物组织样本相邻的组织的一个或多个参考核酸分子确定的。7.用于检测核酸分子中的核苷酸的甲基化的方法,所述方法包括:接收通过测量对应于样本核酸分子中的核苷酸窗口的光信号脉冲而获得的输入数据,并且其中所述窗口包括至少两个核苷酸,所述输入数据包含以下性质的值:对于所述窗口内的每个核苷酸:所述核苷酸的一致性,所述核苷酸相对于相应窗口内的靶位置的位置,对应于所述核苷酸的所述脉冲的宽度,以及脉冲间持续时间,其表示对应于所述核苷酸的所述脉冲与对应于相邻核苷酸的脉冲之间的时间;使用以下步骤确定甲基化是否存在于所述窗口内的靶位置的核苷酸中:对于所述窗口内的每个核苷酸:所述核苷酸的一致性,所述核苷酸相对于所述靶位置的位置,对应于所述核苷酸的所述脉冲的宽度,以及脉冲间持续时间。8.分析怀有胎儿的雌性受试者的生物样本的方法,所述雌性受试者在第一染色体区域中具有第一单倍型和第二单倍型,所述生物样本包括DNA分子,所述方法包括:鉴定与所述第一单倍型对应的多个DNA分子;对于所述多个DNA分子中的每个DNA分子,通过以下步骤来确定所述DNA分子的一个或多个靶核苷酸中的每个靶核苷酸的甲基化状态:(a)接收通过测量对应于所述DNA分子中测序的核苷酸的光信号脉冲而获得的数据,并从所述数据获得以下性质的值:对于每个核苷酸:所述核苷酸的一致性,所述核苷酸的在所述DNA分子中的位置,对应于所述核苷酸的所述脉冲的宽度,以及脉冲间持续时间,其表示对应于所述核苷酸的所述脉冲与对应于相邻核苷酸的脉冲之间的时间;(b)对于在所述样本核酸分子中测序的核苷酸的一个或多个核苷酸中的每一个,创建输入数据结构,所述输入数据结构包括在所述DNA分子中测序的核苷酸的窗口,其中所述窗口包括至少两个核苷酸,并且其中对于所述窗口内的每个核苷酸,所述输入数据结构包括以下性质:所述核苷酸的一致性,所述核苷酸的相对于所述窗口内的靶位置的位置,对应于所述核苷酸的所述脉冲的宽度,以及
脉冲间持续时间;(...

【专利技术属性】
技术研发人员:卢煜明赵慧君陈君赐江培勇郑淑恒彭文磊谢安仪
申请(专利权)人:香港中文大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1