基因鉴定特征(GIS)分析的方法技术

技术编号:1755003 阅读:216 留言:0更新日期:2012-04-11 18:40
包括至少一个双标签的分离寡核苷酸,其中该双标签包括两个连接的第一个和第二个序列标签,其中第一个标签包括核酸分子或其片段的5’端序列,第二标签包括3’端序列。该双标签分析可用于发现基因和基因组作图。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总的涉及基因和转录表达的领域,具体地涉及通过对应于转录本内限定区的基因特征鉴定(GIS)连续分析大量转录本的方法。
技术介绍
人基因组计划最重要的目标之一是提供人和模式生物体基因组的完整基因序列表。基因的完整基因组注释依赖于通过实验和计算机方法的全面转录本组(transcriptome)分析。基因从头开始的预测必需通过实验数据来确认。理想的解决方法是克隆全长转录本并将其全部测序。该方法最近已经获得公认(Strausberg,R.L.,等,1999,Science,286455-457)并已经获得了进展(Jongeneel C V.,等,2003,ProcNatl Acad Sci USA.100,4702-4705)。然而,由于在生物体生命周期的不同发育阶段中表达的转录本的复杂性和无限体积,所有不同转录本组的全部测序分析仍然是不现实的。为了避免这样的困境,已经发展了获得表示全部转录本的部分序列的cDNA标签策略,并在过去十年中广泛用于测定基因和表征转录本组。表达序列标签(EST)方法中,从5’和/或3’端将cDNA克隆测序(Adams,M.,等,1991,Science,252,1651-1656)。每个EST序列读取将产生每个转录本平均500bp的标签。相同或重叠ESTs的数量将表明基因表达活性的相对水平。尽管EST在鉴定基因中是有效的,但是标签转录本组中的每个转录本是禁止性昂贵的。实际上,通常从数百万得到转录本克隆的cDNA文库中获得10,000或更少EST后就停止测序。为了提高测序和计数大量转录本的效率,基于转录本的短特征序列(14-20bp)对表示该基因是足够特异性的事实,发展了基因表达的连续分析(SAGE)(Velculescu,V.E.等,1995,Science,270,484-487;SahaS等,2002,Nature Biotechnology,20,508-12;US6,498,013;US6,383,743)和最近的大量平行特征测序(MPSS)技术(Mao C.,等,2000,Proc NatlAcad Sci USA,97,1665-1670;Brenner S,等,2000,Nature Biotechnology,18,630-634)。用实验方法,从cDNA提取短标签,每个转录本一个标签。这样的短标签可以得到有效测序,通过级联策略(对于SAGE)或对于MPSS通过基于杂交的方法。例如,SAGE中,将多个标签连接成长的DNA片段并克隆用于测序。每个SAGE序列读出通常可以显示20-30个SAGE标签。低于10,000个读数的合适SAGE测序工作将相当大的覆盖(重叠)转录本组。通过简单计数SAGE标签的数字频率来测量转录本丰度。由于公众数据库中许多汇编的基因组序列的可获得性,将短标签策略用于转录本组表征变成通用的(Jongeneel等,2003,Proc.Natl.Acad.Sci.USA 1004702-4705)。理论上,约20bp的短DNA标签可以特异性地作图于复杂哺乳动物基因组中的单个位置并唯一地代表整个转录本组范围内的转录本。然而,实际上,仍然存在大量在基因组中具有多个位置的“不确定的”SAGE标签(14-21bp)和MPSS标签(17bp),并被许多基因共享。受到可以切割长于21bp的II型限制酶有效性的限制,目前SAGE方法没有产生任何更长的标签来提高特异性。此外,SAGE和MPSS方法在基因中间每个转录本只产生了单个特征。就转录本中标签的“内在”性质而言,这些方法只提供了有限的标签信息。因此,尽管它们在测序效率中的用途,因其特异性的缺乏和随后的不确定性如SAGE或MPSS方法的利用受到严重地破坏。本领域中存在对更有效方法的需要,该方法保持了测序效率,同时提高了标签策略对转录本组表征和帮助基因组注释的用途。
技术实现思路
通过提供每个核酸分子两个标签(双标签),本专利技术解决了上述的问题,因此提高了标签表示核酸分子(例如基因)的特异性。从相同核酸分子的5’和3’端提取两个标签,因此双标签是更多信息的来反映核酸分子的结构。决定性地,本专利技术提供了将相同核酸分子的5’和3’标签连接成单个双标签单体的方法。因此,可以通过简单的测序分析容易地鉴定出表示核酸分子的5’和3’标签对。本专利技术可以用于鉴定新的基因、用于测量转录本组中的转录本丰度、用于注释基因组序列,同时提高了测序效率。特别地,本专利技术提供了包括至少一个双标签的分离寡核苷酸,其中双标签包括两个连接的第一个和第二个序列标签,其中第一个标签包括核酸分子的5’端序列和第二个标签包括3’端序列。本专利技术的寡核苷酸,进一步包括双标签两侧的至少两个连接物,其中每个连接物包括至少一个限制位点。特别地,每个连接物至少包括标签近端的第一个限制位点,其是不对称限制位点(例如,归巢(homing)限制内切酶限制位点,和II型限制位点)和至少第二个限制位点。作为第二个或更多的限制位点,可以使用本领域已知的任何限制位点。例如,BamHI。此外,可以使用不同于第一个限制位点的任何不对称限制位点。然而,对于该酶的限制位点,必需不存在于插入双标签后的载体主链中。核酸分子可以是基因的全长序列或其片段。例如,RNA、mRNA、基因组DNA、全长cDNA或cDNA。双标签的核苷酸数量可以改变。根据一实施方案,在至少一个限制酶存在下,通过拼接核酸分子的5’端和3’端获得,且通过所用的限制酶来决定序列标签的大小。因此,双标签的核苷酸数量根据所用的限制酶而改变。当使用MmeI时,该酶识别存在于想要缩减(reduce)的核酸分子两侧的两个连接物中每个中的序列,但是在核酸分子内切割形成包括19-21个核苷酸的标签。通过平端化并连接将两个这样的标签另外处理来形成包括34-38个核苷酸的双标签。因此通过将相同核酸分子的5’端和3’端拼接在一起来获得双标签。本专利技术的双标签可以是任何大小的,优选12-60bp。寡核苷酸可以包括双标签的串连体,例如,1至1000个双标签。本专利技术还提供了含有本专利技术寡核苷酸的载体。特别地,载体包括至少一个核酸分子和核酸分子两侧的至少两个连接物,其中每个连接物至少包括第一个限制位点,其是不对称限制位点(例如,不对称限制位点是归巢内切酶限制位点,或II型识别位点)和至少第二个限制位点(例如,Bam HI),且载体的主链不包括不对称限制位点和第二个或更多的限制位点。优选的不对称限制位点是II型限制位点MmeI。本专利技术还提供了具有SEQ ID NO18中所示序列的载体。本专利技术进一步提供了cDNA文库,其中每个cDNA克隆包括至少一个本专利技术的寡核苷酸。根据另一方面,本专利技术还提供了制备包括至少一个双标签的至少一个寡核苷酸的方法,包括产生至少一个核酸分子;分离核酸分子或其片段的5’端和3’端;连接5’端和3’端产生至少一个双标签。特别地,提供了制备包括至少一个双标签的至少一个寡核苷酸的方法,包括产生至少一个两侧有两个连接物的核酸分子;分离核酸分子的5’端和3’端;连接5‘端和3’端产生至少一个寡核苷酸,该寡核苷酸包括至少一个两侧有两个连接物的双标签。希望以双标签形式得到缩减的核酸分子可以是完整的核酸分子或核酸分子内的一部分。核酸分子可以对应于全本文档来自技高网
...

【技术保护点】
包括至少一个双标签的分离寡核苷酸,其中该双标签包括两个连接的第一个和第二个序列标签,其中第一个标签包括核酸分子或其片段的5’端序列,第二个标签包括3’端序列。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:阮一骏黄伟鹏卫嘉玲
申请(专利权)人:新加坡科技研究局
类型:发明
国别省市:SG[新加坡]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1