基于配对末端随机序列的基因分型制造技术

技术编号:9493679 阅读:134 留言:0更新日期:2013-12-26 04:22
通过提供带标识物标签的限制性片段、使用配对高通量测序技术获得序列信息、组合该序列信息并鉴定该样品间多态性来同时发现、检测样品间多态性以及进行基因分型的方法。来自两个末端的序列信息组合能发现、检测高度重复性基因组中的多态性以及进行基因分型。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】通过提供带标识物标签的限制性片段、使用配对高通量测序技术获得序列信息、组合该序列信息并鉴定该样品间多态性来同时发现、检测样品间多态性以及进行基因分型的方法。来自两个末端的序列信息组合能发现、检测高度重复性基因组中的多态性以及进行基因分型。【专利说明】基于配对末端随机序列的基因分型专利技术背景目前使用的大部分标记物发现和基因分型技术主要依赖于两种不同的系统,一种是最初发现的SNP,另一种是之后对大量个体进行的基因分型。这激发本 申请人:开发一种基于序列的同步标记物发现和检测技术,称为基于随机序列的基因分型(rSBG)。该技术引入了 Illumina GAII的高通量测序能力以及AFLP'K' (EP534858)的基因组复杂性减低能力。其示例描述在本 申请人:的W02007073165中。与各种通常经靶向的其它基因分型技术(即,先选择待检测SNP,并用特异性检测探针靶向)相反,rSBG是随机方法。原则上,当AFLP模板中含有特异性序列时可鉴定品系间存在的所有SNP(通常在使用严格的挖掘过滤(miningfilter)后)。其中一个问题是当分析样品来自含有相对大部分重复性序列的基因组时,例如辣椒,鉴定品系间多态性会由于重复性序列的存在而变得更难。
技术实现思路
本专利技术人发现可改进在多种样品中评分和基因分型的多态性数目,特别是在使用来自视作高度重复性(即包含许多重复)的基因组样品,使用高通量测序方法来测序限制性片段的两个末端时。通过采用称为配对末端测序的方法,从相同限制性片段中获得两组序列数据(即序列读数),各来自限制性片段的一 端。通过组合这些数据组,原来由于例如源自重复片段从而不能相互区分的来自限制性片段的序列数据(序列读数)现在变得可区分了。原因是来自位于上百或甚至上千个核苷酸之外限制性片段另一端的序列读数(通常依赖于所用的限制性酶或片段化方法),能产生独特的组合序列读数(参见图1)。这也能发现、检测来自高度重复性基因组样品的多态性以及进行基因分型。因此本专利技术方法相比现有技术方法可以最广泛形式应用于更大范围的样品,因为其成功包括了高重复性样品。本专利技术人发现用该配对末端方法相比单独分析片段各端读数可发现更多SNP并进行基因分型,即,由于在SNP的同步发现和基因分型中使用配对末端测序而获得协同作用。附图简要说明图1.基于配对末端随机序列的基因分型示意图。从限制性片段各端形成双标签(ditag)以实现最大的重复序列分离从而用于SNP鉴定。定义在以下说明和实施例中,使用了一些术语。为了提供对说明书和权利要求的清楚和一致的理解,包括给予所述术语的范围,提供了下列定义。除非另外定义,本文中使用的所有技术和科学术语具有本专利技术所属领域普通技术人员通常所理解的同样含义。所有出版物、专利申请、专利和其他文献的公开内容都通过引用全文纳入本文。本领域技术人员清楚了解本专利技术方法实施所使用的常规技术。本领域技术人员熟知分子生物学、生物化学、计算化学、细胞培养、重组DNA、生物信息学、基因组学、测序和相关的领域中的常规技术实践,并在例如以下参考文献中描述:SambiOOk等,《分子克隆.实验室手册》(Molecular Cloning:A Laboratory Manual),第二版,纽约冷泉港的冷泉港出版社(Cold Spring Harbor Laboratory Press), 1989 ;Ausubel 等,《新编分子生物学实验指南》(Current Protocols in Molecular Biology),纽约的约翰威利父子公司(John Wiley&Sons), 1987及定期更新;和《酶学方法》系列(the series Methods inEnzymology),圣地亚哥的学术出版社(Academic Press)。本文所用的单数形式“一个”、“一种”和“该”包括复数指代形式,除非文中另有明确说明。例如,分离“一个”DNA分子的方法包括分离多个分子(例如,十、百、千、万、十万、百万或更多的分子)。多态性:多态性指一个群体中存在两种或多种核苷酸序列变体。多态性可以包括一个或多个碱基改变,插入,重复,或缺失。多态性包括例如简单序列重复(SSR)和单核苷酸多态性(SNP),其为DNA序列变异,在单个核苷酸:腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)或鸟嘌呤(G)改变时发生。通常群中至少1%发生变异被视为SNP。SNP占(例如)所有人类遗传变异的90%,人类基因组中每100至300个碱基即出现。每三个SNP中有两个是腺嘌呤(T)取代胞嘧啶(C)。例如人类和植物的DNA序列变异会影响其如何处理疾病、细菌、病毒、化学试剂、药物等。基因分型指测定种类中个体遗传变异的方法。生物基因型是其遗传密码内携带的遗传指令(inherited instruction)。并非所有具有相同基因型的生物表观或行为方式相同,因为表观和行为由环境和发育条件修饰。同样,并非所有看上去很像的生物肯定具有相同的基因型。单核苷酸多态性(SNP)是最常见的遗传变异类型并定义为在高于1%群中发现的特异性基因座的单碱基差异。在基因组编码以及非编码区域都发现SNP,其可能导致不同表型,例如,在编码区发现时,具有患病或耐受疾病的能力。因此,SNP常用作特定疾病或一些表型的标记物。当发现于非编码区时,SNP用作进化基因组研究的标记物。SNP涉及不同长度的核苷酸“插入缺失标记(InDel)”或插入和缺失。第三种遗传变异类型是拷贝数变异(CNV),其源于不同基因组中具有不同拷贝数的DNA片段。编码基因拷贝数变化的情况中,所述变化会导致对疾病的易感性或抵抗性。一些表型还是剂量敏感性,拷贝数引起种类成员间的不同差异。对于SNP和CNV基因分型,存在许多测定个体间基因型的方法。选择方法通常取决于通量需要,其随着基因分型的个体数量和各个体所测的基因型数量而变化。所选方法还取决于各 个体或样品中可得的样品材料量。基因型是细胞、器官、或个体(即个体的特异性等位基因组成)通常参照考虑中的特异性性状和特性的遗传组成。表型是可观察的生物性状和特性,例如其形态、发育、生化或生理特性、物候学、行为和行为产物。表型来自环境因素的基因表达和影响以及两者间的相互作用。虽然表型是生物表现出的总体可观察特性,术语表型组有时指特性集合,其同步研究称为表型组学。表型分型是测定生物表型。限制性内切核酸酶:限制性内切核酸酶或限制性酶是一种酶,其识别双链DNA分子中的特定核苷酸序列(靶位点),并能在每个靶位点处或附近切开两条链,得到钝端或交错末端。限制性片段:用限制性内切核酸酶消化产生的DNA分子被称作限制性片段。用特定限制性内切核酸酶消化任何给定基因组(或核酸,不论其来源),得到一组离散的限制性片段。限制性内切酶切割产生的DNA片段还可用于各种技术。加标签:术语加标签指在核酸样品中加入标签,从而能区分其与第二或更多核酸样品。标识物或标识物标签:一种短序列,其可加到衔接子或引物上,或包括在其序列中,或用作标记以提供独特的识别物。这种序列标识物(标签)可以例如是长度变化(通常为4-16bp)但确定的独特碱基序列。标识物或标识物组合可用于鉴定特异性核酸样品或连接或结合DNA产物,例如本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:M·J·T·范艾克
申请(专利权)人:关键基因股份有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1