单倍型方法技术

技术编号:32808410 阅读:22 留言:0更新日期:2022-03-26 20:01
本发明专利技术涉及使用单倍型定相检测可能与疾病或病症相关的基因的异常表达。特别地,本发明专利技术涉及获得靶真核细胞中基因的至少两个等位基因的表达水平之间失调的指示的方法。该方法包括针对来自一个或多个靶真核细胞的多个基因的步骤,(a)获得相同基因的至少两个等位基因的前mRNA;和(b)确定相同基因的一对或多对等位基因(i,j)的前mRNA量之间的比率(Ri,j)。等位基因(i,j)的前mRNA量之间的比率(Ri,j)。等位基因(i,j)的前mRNA量之间的比率(Ri,j)。

【技术实现步骤摘要】
【国外来华专利技术】单倍型方法
[0001]本专利技术涉及使用单倍型定相检测可能与疾病或病症相关的基因的异常表达。特别地,本专利技术涉及获得靶真核细胞中基因的至少两个等位基因的表达水平之间失调的指示的方法。
[0002]常见变异全基因组关联研究(GWAS)已经确定数以万计的与复杂性状(例如体重指数、身高等)和对常见疾病(例如糖尿病、心脏病、免疫疾病和癌症易感性)相关的遗传变异。尽管遗传学具有统计学意义,但识别GWAS信号背后的致病变异和基因一直受到两大因素的阻碍。首先,由于基因组内序列变异的广泛联系,因果序列很难精确确定;并且其次,不管所讨论的特定GWAS,绝大多数变体都位于可解释的编码基因组外。
[0003]解释非编码基因组的能力是生物医学科学的优先事项。在过去的十年中,我们对非编码DNA的理解已经从“垃圾”演变成控制编码和非编码转录组的表达和功能的复杂调节线路。该功能的核心是调节性非编码元件:启动子、增强子和内含子/外显子边界。尽管某些调控元件的存在已有几十年的历史,但它们的普遍存在(在发育和常规细胞过程中具有关键的组织特异性作用)直到最近二十年才变得清晰。这些元素与常见疾病的遗传学之间的巨大重叠已经开始使人们理解GWAS信号的混杂非编码分布。
[0004]特别是,需要对转录组(即一个细胞或细胞群中的所有RNA分子的集合)进行进一步研究以帮助识别在特定疾病(或其相关生化途径)中异常表达的基因,并且因此确定候选药物靶点。
[0005]基因的异常表达可能是由于调节基因表达的元素发生变化。这些元素的变化可能导致基因的过度表达或表达不足,基因的时间表达或它们的组织特异性的变化。
[0006]众所周知,这种变化也可能导致单个细胞或细胞群内相同基因的不同等位基因的表达水平的失调;并且这种失调也可能与特定的疾病或病症有关。
[0007]确定细胞内等位基因(即单倍型)的序列变异之间的联系称为“定相”;并且等位基因的表达水平不同的发现被称为“等位基因偏斜”。
[0008]传统上,大多数mRNA的生化和遗传分析都在polyA
+
mRNA上进行。首先从细胞中提取总RNA;然后向下通过oligo

dT柱以结合polyA
+
mRNA;并且然后polyA
+
mRNA从柱上选择性地洗脱。PolyA
+
RNA包含mRNA的编码序列,即(非编码)内含子已被去除,并且这是研究人员通常最感兴趣的mRNA形式。使用poly

dT柱还有一个优点,即rRNA(这是一种不需要的污染物并且在所有细胞中大量表达)可以通过这种方法去除。
[0009]专利技术人现在已经认识到,可以通过使用不限于polyA
+
RNA的mRNA来获得来自转录组的额外信息。更具体地说,他们已经认识到,如果使用前mRNA(例如polyA

mRNA,其仍然包含内含子),在内含子和下游序列中发现并在polyA
+
RNA中去除的基因组序列中的自然变异可用于确定等位基因偏斜,从而识别失调的基因。重要的是,当在非定相基因组序列中进行时,所有序列变体都可以归因于特定等位基因以确定整个基因的等位基因偏斜并将这些与基因体外的序列变异联系起来。
[0010]虽然polyA

mRNA的分离以前是已知的(例如Kowalczyk,2012),但它以前没有用于基因单倍型或等位基因偏斜的背景下。
[0011]EP 1829979 A1涉及在cDNA中搜索基因多态性(例如SNP)的方法,作为识别等位基因之间表达水平不同的基因的手段。专利技术人认识到成熟的polyA+mRNA在剪接后仅具有一个外显子序列并且因此此类序列“太短”而不能包含足够的SNP以进行评估。因此,专利技术人选择核内RNA以提供“长链”,预期该“长链”包含许多遗传多态性,这些遗传多态性可能使等位基因之间表达水平不同的基因能够被区分(参见第[0006]和[0018]段)。
[0012]James等人(2013年)使用前RNA来检测免疫细胞中受刺激条件下一个等位基因相对于另一个等位基因表达的偏斜,但在非定相基因组的背景下没有这样做以与遗传学联系或在基因内或远端的表观基因组中测试基因组中的功能偏斜。
[0013]Sigurdsson等人(2008年)在非定相基因组的背景下使用等位基因偏斜来检测具有位于基因体内的风险单倍型的等位基因偏斜,但在非定相基因组的背景下没有这样做以与遗传学联系或测试基因内或基因远端的表观基因组的功能偏斜。
[0014]Thomas等人(2011)结合表观遗传偏斜和基因表达偏斜的使用来研究与单等位基因相关的表观遗传效应,但仅在基因体内,因为他们不在非定相基因组的背景下使用它。
[0015]Rainbow等人(2008)使用前mRNA形式来观察IL

2基因表达的等位基因特异性差异,但这不是在与远端调控景观或遗传学相关的非定相基因组的背景下。
[0016]本专利技术的目的是提供一种获得靶真核细胞中相同基因的不同等位基因的表达水平之间失调指示的方法,该方法包括使用前mRNA。在非定相基因组中,这种失调然后可以与基因体外部的序列变异相关联,从而导致受影响等位基因上的基因失调。
[0017]如果没有定相,则在RNA分析中检测到的每个SNP(除非它们靠得很近,即在<300bp的短距离内)在不具有所有SNP都在相同的方向上偏斜的假设的情况下不能分配给相同的等位基因。因此,它们不能用于为给定等位基因的等位基因偏斜增加统计稳健性。就RNA中的表示变化和偏斜方向而言,通过定相,可以将所有SNP分配给给定的等位基因并且可以在统计上看到其行为相似。
[0018]更重要的是,如果没有定相,这种偏斜的RNA表达不能与基因外的变化联系起来。在相同染色体上以顺式方式控制基因表达的调控元件可以位于距它们控制的基因至多200万个碱基对的位置。使用定相,在遗传上将序列变化与给定性状或疾病联系起来的基因型可以被视为与在其等位基因偏斜表达中表现可重复的基因位于相同的等位基因上。这也允许人们将远端SNP的表观遗传变化与同一染色体上等位基因的表达变化联系起来。这些表观遗传变化可以使用等位基因偏斜来检测,用于测量增强子活性的基于序列的基因组测定,例如开放染色质测定(例如DNAse

seq或ATAC

seq)、与调节活性相关的染色质标记(例如用于染色质标记如H3k27ac、H3k4me1或用于蛋白质结合,如RNA聚合酶、转录因子结合的ChIP

seq)或重要调节结构蛋白的结合,如CTCF。
[0019]本专利技术涉及使用单倍型定相检测可能与疾病或病症相关的基因的异常表达。
[0020]使用本专利技术的方法,可以将基因表达中的偏斜与与基因体外的性状和疾病性状相关的遗传信号联系起来,其中它们通常在基因体外被富集。它还允许将基因表达中的偏斜与与调控活动相关的基于序列的基因组学分析本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种识别基因的等位基因中的突变的方法,所述突变可以导致靶真核细胞中的基因的等位基因的表达水平的失调,所述方法包括以下步骤:对于来自一个或多个靶真核细胞的多个基因,(a)获得所述基因的至少两个等位基因的前mRNA;和(b)确定所述基因的一对或多对等位基因(i,j)的前mRNA量之间的比率(R
i,j
);其中当所述基因的等位基因对(i,j)的R
i,j
≠1时,或响应于确定对于所述基因的等位基因对(i,j),R
i,j
≠1,所述方法还包括以下步骤:(c)确定所述对等位基因的核苷酸序列;和(d)比较所述对等位基因的核苷酸序列以识别所述对等位基因的核苷酸序列之间的差异;其中所述基因的等位基因对的核苷酸序列之间的一个或多个差异可能是导致在靶真核细胞中该基因的两个等位基因的表达水平失调的突变。2.根据权利要求1所述的方法,其中当对于所述基因的等位基因对(i,j),R
i,j
<0.9或R
i,j
>1.1时,或响应于对于所述基因的等位基因对(i,j),确定R
i,j
<0.9或R
i,j
>1.1,所述方法包括以下步骤:(c)确定所述对等位基因的核苷酸序列;和(d)比较所述对等位基因的核苷酸序列以识别所述对等位基因的核苷酸序列之间的差异;其中所述基因的等位基因对的核苷酸序列之间的一个或多个差异可能是导致在靶真核细胞中该基因的两个等位基因的表达水平失调的突变。3.根据权利要求1或2所述的方法,其中步骤(c)使用RNA

Seq进行。4.根据权利要求3所述的方法,其中通过在RNA

Seq数据内识别已知对那个等位基因特异的内含子、外显子和下游转录区域中的序列变化来识别和计数源自特定等位基因的序列。5.根据前述权利要求中任一项所述的方法,其中如果Ri,j<0.9或Ri,j>1.1,那么这表明在控制所述基因表达的一个等位基因上的调节元件中存在变化,优选其中所述调节元件是存在于所述基因内含子内或所述基因体外(优选编码区)的调节元件。6.根据权利要求3或4所述的方法,其中所述方法另外包括进行基于序列的测定(优选ATAC

seq、DNase

see或ChIP

seq)的进一步步骤,所述测定测量所述调节元件的活性以检测在使用RNA

seq发现倾斜的基因的相同等位基因上倾斜。7.一种获得所述靶真核细胞中的相同基因的至少两个等位基因的表达水平之间失调指示的方法,所述方法包括以下步骤:对于来自一个或多个靶真核细胞的多个基因,(a)获得相同基因的至少两个等位基因的前mRNA;和(b)确定相同基因的一对或多对等位基因(i,j)的前mRNA量之间的比率(R
i,j
);其中如果对于相同基因的一对或多对等位基因(i,j),R
i,j
≠1,则这表明所述基因的这两个等位基因在所述靶真核细胞中的表达水平之间存...

【专利技术属性】
技术研发人员:J
申请(专利权)人:牛津大学科技创新有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1