应用全基因组捕获转座子间区段序列对受微生物污染的人类DNA样本进行基因组序列分析制造技术

技术编号:23563521 阅读:38 留言:0更新日期:2020-03-25 07:59
一种用于鉴定人类基因组DNA中一个或多个基因组变异的方法,包括使用Alu、MIR、SVA序列基引物,并对测定混合物进行转座子间聚合酶链式反应(ITE‑PCR),以产生一阵列包含ITE基因组区段的扩增子。还提供了所述方法在鉴定与性质或者疾病相关的一个或多个基因组变异中的应用。

Genomic sequence analysis of human DNA samples contaminated by microorganisms by whole genome capture transposon segment sequence

【技术实现步骤摘要】
【国外来华专利技术】应用全基因组捕获转座子间区段序列对受微生物污染的人类DNA样本进行基因组序列分析电子提交的参考序列表序列表的正式版本,是以ASCII格式通过ePCT电子方式提交,文档大小2.5千字节(kilobytes),称为“PHGL1002.WOGENESEQUENCELISTING”,于2018年5月18日创建,并与说明书一并提交。所述ASCII格式文档中的序列表属该说明书的一部分,引用时全部内容将并入说明书。
本专利技术大致涉及一种序列和结构变异的分析方法,可应用在被微生物DNA污染的人类DNA样品上。具体地说,本专利技术利用基因组中众多Alu、MIR和SVA逆转录转座子插入位点,以多核苷酸链式反应(PCR)及基于Alu-、MIR-、SVA-共有序列设计的PCR引物,扩增转座子间(ITE)的基因组区段,并通过‘AlmivaScan’测序平台进行大规模并行测序(MPS)对扩增子进行序列分析。由于没有任何相关报道指出细菌和病毒DNA中存在Alu、MIR和SVA逆转录转座子,采用所述AlmivaScan测序方法,共存微生物DNA对人类基因组分析的干扰将会非常小。这开启了AlmivaScan的应用,使被细菌和病毒污染的人类分泌物和排泄物DNA的序列分析变得可行。
技术介绍
虽然有多种方法平台能有效率地分析人类基因组序列,包括全基因组测序(“WGS”)和全外显子测序(“WES”),但是对DNA样本的需求是不能被其他物种DNA污染。因此,诸如痰液中常带有肺和上呼吸道组织DNA,包括肺癌和上呼吸道癌的DNA,及粪便中常含有胃肠组织DNA,包括胃肠道癌DNA;但因为这些痰液或粪便DNA往往受到肺部和上呼吸道的细菌和病毒及胃肠道的生物群落污染,使DNA分析变得困难。由于Alu逆转录转座子仅在灵长类动物DNA中发现,MIR逆转录转座子仅在哺乳动物中发现,及SVA逆转录转座子仅在人科动物中发现,那使用基于Alu-、MIR-和SVA-共有序列设计的PCR引物扩增人类基因组DNA时,即使当中存在细菌和病毒DNA,仍会获得具人类DNA特异性的扩增子,序列分析也不会受到干扰。因此,本专利技术的目的是要开发和测试所述方法的实用性,用于分析受微生物污染的人类分泌物和排泄物如痰液和粪便中的人类DNA。痰液中含有来自肺部和上呼吸道的癌症和癌前细胞,而粪便中含有来自胃肠的癌细胞。所以,若可以对这些样本中的人类DNA进行分析,将加速早期癌症检测,及监测治疗后癌细胞存活和/或变异的情况。转座子是单细胞基因组中一段可移动的DNA序列。转座的发生能改变细胞的基因组,造成表型上的显著突变。人类最常见的转座子形式是逆转录转座子,包括Alu序列,MIR序列和SVA序列,是人类基因组中的重复序列家族。通常,Alu元件长约280个碱基对,MIR元件长约145个碱基对,均为重复性DNA元件类别,且同属短散在元件(“SINEs”),而SVA元件长约1000个碱基对。在人类基因组中,大约有1,080,000个Alu重复序列、595,000个MIR重复元件和3,700个SVA重复元件。本文所用术语“Alu元件”包含一短段DNA,具有限制性内切核酸酶Alu(藤黄节杆菌)的识别序列。在灵长类动物基因组中存在着大量不同种类的Alu元件。事实上,Alu元件是人类基因组中最丰富的转座元件。它们源于小胞浆7SLRNA,是信号识别颗粒的一个组成部分。Alu序列的典型结构是5'-A部分-A5TACA6-B部分-PolyA尾-3'(SEQIDNO:1)。由于A部分和B部分的核苷酸序列相似,其结构揭示了现代人类Alu元件是在1亿年前由两种不同的古化石单体融合而成。Alu家族中不同成员间的Poly-A尾长度参差不一。首被发现的Alu元件亚家族为AluJ和AluS,其它Alu亚家族成员也很快被发现。而其中AluS的其一亚亚家族因包含活跃Alu元件,最终被命名为AluY。本文所用术语“MIR元件”包含久远的重复序列家族,广泛发生于胎盘哺乳动物、有袋动物和单孔目动物中,并有着序列差异,这显示它们为丰富的全哺乳动物的散在重复序列,或简称MIRs。MIR元件的典型结构是由一段tRNA源性区域与一无相关序列融合组成,而该tRNA源性区域包含RNA聚合酶III启动子共有序列,并与人类Gln-tRNA-CUG基因相似。本文所用术语“VNTR”代表可变数目串联重复序列,尽管不是所有串联重复结构域中的重复拷贝数均属多态性,但也包含微卫星和小卫星。本文所用术语“SVA元件”涵盖由SINE-VNTR-Alu组成的非自主人科动物逆转录转座子家族,由于SVAs正处于活跃状态,因此它们可以通过多种机制,包括突变、外显子改组、选择性剪接和通过产生差异性甲基化区域,导致基因组变异,甚至能改变人类性状。表型是指任何受基因型影响的可观察参数,包括RNA和蛋白质类分子。纵使大多数由遗传物质编码合成的分子和结构在生物体上是不可见的,但它们是可观察的(通过表型如细胞形态等),因此也属表型的一部分。人类血型就是一个典型例子,决定血型的基因型,其表型在细胞水平表达。因此,人类中的基因组序列和结构变异可应用于分析人类受试者之间的基因型及表型差异。在同一个体内,细胞也可能发生体细胞突变,导致基因型及表型改变;如导致癌症的恶性突变。大规模并行测序技术(MPS)彻底改变了遗传学的进程,它能通过一次运行产生千兆碱基序列信息,大大降低了WGS的成本,并已被广泛用于性状关联和疾病关联的研究。然而,其主要缺点为需要较大的DNA量。在大多数情况下,甚至3微克的基因组DNA仍未能完全达到全基因组测序的严格要求。人类分泌物和排泄物中所含的人类总DNA量通常是有限的,要获取达微克量需求的DNA样品就更加困难。有鉴于此,须要采用新方法以求降低所需DNA量和测序成本,产生高质相应序列数据。聚合酶链式反应技术(“PCR”)允许用者采集有限量的起始基因组DNA,并从基因组不同区域进行扩增,获取足够DNA量用于序列分析。然而,由于要从基因组不同区域扩增大量序列,需要使用很多昂贵的PCR引物,所以本专利技术开发了一种能选择性地扩增逆转录转座子间ITE区段序列的方法,仅需使用少量特定设计的PCR引物,如基于Alu元件共有序列设计的PCR引物。美国专利号5,773,649,标题为“用于检测癌细胞突变体表型的DNA标记物和诊断癌细胞的方法”,专利技术者为Sinnett等人,于1998年6月30日发布,称之为“Sinnett649专利”。Sinnett649专利使用了配对Alu间PCR(inter-AluPCR)引物进行扩增,扩增片段与对应不稳定易感性基因座的探针杂交,并在聚丙烯酰胺凝胶上进行电泳分级,以确定肿瘤和无肿瘤DNA之间是否存在变异条带。这种inter-AluPCR系统,仅使用配对PCR引物,而PCR扩增子在凝胶电泳中呈条带状模式。美国专利号7,537,889,标题为“Alu元件于人类DNA量化检测中的应用”,专利技术者为Sinha等人,于2009年5月26日发布,称之为“Sinha889专利”。Sinha889专利使用了配对inter-AluPC本文档来自技高网...

【技术保护点】
1.一种应用于鉴定人类基因组DNA一或多种基因组变异的方法,所述方法包括:/n测定混合物的制备,当中包含/n测试样品,内含人类基因组DNA;/n(a)两条或以上引物,其中每条引物包含基于人类基因组转座子(TE)或其它重复元件的共有序列,所述转座子(TE)或其他重复元件通常在微生物中不会出现;/n(c)分别含腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)碱基的游离脱氧核苷酸三磷酸(dNTPs);/n(d)热稳定DNA聚合酶;/n(e)缓冲液;及/n对测定混合物进行聚合酶链式反应(PCR),产生一含基因组转座子间(ITE)区段的扩增子的阵列。/n

【技术特征摘要】
【国外来华专利技术】20170518 US 62/507,8141.一种应用于鉴定人类基因组DNA一或多种基因组变异的方法,所述方法包括:
测定混合物的制备,当中包含
测试样品,内含人类基因组DNA;
(a)两条或以上引物,其中每条引物包含基于人类基因组转座子(TE)或其它重复元件的共有序列,所述转座子(TE)或其他重复元件通常在微生物中不会出现;
(c)分别含腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)碱基的游离脱氧核苷酸三磷酸(dNTPs);
(d)热稳定DNA聚合酶;
(e)缓冲液;及
对测定混合物进行聚合酶链式反应(PCR),产生一含基因组转座子间(ITE)区段的扩增子的阵列。


2.权利要求1所述方法,进一步包括使用高通量DNA测序对扩增子进行测序。


3.权利要求2所述方法,进一步将扩增序列与对照DNA样品中的相同人类基因组区域序列进行比较,以鉴定测试样品及对照样品之间存在的一或多种基因组变异。


4.一种应用于鉴定一或多种与性状或疾病相关的基因组变异的方法,所述方法包括:
第一测定混合物的制备,当中包含
(a)第一测试样品,内含人类基因组DNA,其中所述第一测试样品取自具有某特定性状或疾病的人类受试者;
(b)两条或以上引物,其中每条引物包含人类基因组转座子(TE)或其它重复元件的共有序列;所述转座子(TE)或其他重复元件通常在细菌及病毒中不会出现;
(c)分别含腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)碱基的游离脱氧核苷酸三磷酸(dNTPs);
(d)热稳定DNA聚合酶;
(e)缓冲液;和
第二测定混合物的制备,当中包含
(a)第二测试样品,内含人类基因组DNA,取自没有所述特定性状或疾病的人类受试者;
(b)两条或以上引物,其中两条或以上引物的序列与第一测定混合物中的两条或以上引物的序列相同;
(c)分别含腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)碱基的游离脱氧核苷酸三磷酸(dNTPs);
(d)热稳定DNA聚合酶;
(e)缓冲液;和
分别对第一和第二测定混合物进行聚合酶链式反应(PCR),并产生源自第一测试样品的第一基因组转座子间(ITE)扩增子阵列,以及源自第二测试样品的第二基因组转座子间(ITE)扩增子阵列。


5.权利要求4所述方法,其中所述方法进一步包括使用高通量DNA测序对所述第一和第二扩增子阵列进行测序。


6.权利要求5所述方法,其中所述方法进一步包括将第一扩增子阵列的序列与第二扩增子阵列的序列进行比较,鉴定所述第一和第二测试样品之间的一或多种基因组变异,其中,仅出现于第一个测试样品中而不出现于第二测试样品的基因组变异指示该基因组变异可能与该特定性状或疾病相关联。


7.权利要求1-6任一所述方法,其中所述基因组变异包括:单核苷酸多态性(SNP)、微卫星(MST)、种系拷贝数变异(CNVG)、体细胞拷贝数变异(CNVT),或其任何组合。


8.权利要求7所述方法,其中所述CNVG包括:短CNVG、中长CNVG、长CNVG,或其任何组合。


9.权利要求1-8任一所述方法,其中所述第一测试样品和/或第二测试样品包括:人类白细胞、人类痰液、人类粪便、人类血浆、人类血清、人类尿液、人类唾液,或其任何组合。


10.权利要求9所述方法,其中所述第一测试样品和/或第二测试样品包含源自人类受试者的粪便样品,其中所述人类受试者于取样前,须经过至少约72小时无进食含哺乳或脊椎动物肉类或组织的食物。


11.权利要求1-10任一中所述方法,其中所述第一测试样品和/或第二测试样品含亚微克量人类DNA。


12.权利要求1-11任一所述方法,其中所述第一测试样品和/或第二测试样品包含微生物DNA、植物DNA、非人类动物DNA,或其任何组合。


13.权利要求1-12任一所述方法,其中所述第一测试样品和/或第二测试样品进一步包含微生物DNA、植物DNA,或两者都有。


14.权利要求1-13任一所述方法,其中两条或以上引物的每一条包含基于人类基因组转座子(TE)序列的共有序列,其中所述TE通常不会在微生物DNA中出现。


15.权利要求1-14任一所述方法,其中两条或以上引物的每一个包含一一基于Alu-元件转座子的共有序列,一条基于MIR-元件的共有序列,或一条基于SVA-元件的共有序列。


16.权利要求15所述方法,其中所述测定混合物、第一测定混合物和/或第二测定混合物包含:
(a)至少一条包含基于Alu元件的共有序列的引物和至少一条包含基于MIR元件的共有序列的引物;
(b)至少一条包含基于Alu元件的共有序列的引物和至少一条包含基于SVA元件的共有序列的引物;
(c)至少一条包含基于MIR元件的共有序列的引物和至少一条包含基于SVA元件的共有序列的引物;
(d)至少两条包含基于MIR元件的共有序列的引物;或
(e)至少两条包含基于SVA元件的共有序列的引物。


17.权利要求15所述方法,其中所述测定混合物、第一测定混合物和/或第二测定混合物包含:
(a)至少一条包含基于Alu元件的共有序列的引物;
(b)优选两条或以上引物,每个引物包含基于Alu元件的共有序列;
(c)更优选两条或以上引物,每条引物包含基于Alu元件的共有序列,以及一条或以上引物,每条引物包含基于MIR元件的共有序列;
(d)更优选两条或以上引物,每条引物包含基于Alu元件的共有序列,以及一条或以上引物,每条引物包含基于SVA元件的共有序列;或
(e)最优选至少四条或以上引物,每条引物包含基于Alu元件的共有序列,以及至少一条或以上引物,每条引物包含基于MIR元件的共有序列,以及至少一条或以上引物,每条引物包含基于SVA元件的共有序列。


18.权利要求15所述方法,其中至少一条引物包含一基于Alu元件的共有序列。


19.权利要求18所述方法,其中至少一条引物包含选自以下一条的核苷酸序列:TGGTCTCGATCTCCTGACCTC(SEQIDNO:2),GAGCGAGACTCCGTCTCA(SEQIDNO:3),TGAGCCACCGCG(SEQIDNO:4),AGCGAGACTCCG(SEQIDNO:5),AGCTTGCAGTG...

【专利技术属性】
技术研发人员:薛红
申请(专利权)人:华晶基因技术有限公司
类型:发明
国别省市:中国香港;81

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1