用于在基因组中表征DNA序列组成的方法技术

技术编号:24802434 阅读:39 留言:0更新日期:2020-07-07 21:32
本发明专利技术涉及用于在基因组中表征DNA序列组成的方法。具体地,本文公开了针对转基因事件进行高通量分析的方法。所述方法使用经剪切的基因组DNA的文库,其连接到专门的接头并且合并以用于序列分析以及与已知基因组和插入序列的比较。所述方法可用于检测表征插入位点、转基因完整性,以及转基因拷贝数。

【技术实现步骤摘要】
用于在基因组中表征DNA序列组成的方法本申请是申请日为2014年4月17的中国专利申请201480021755.8“用于在基因组中表征DNA序列组成的方法”的分案申请。
本专利技术涉及植物生物
更具体地讲,本专利技术涉及确定植物基因组内的DNA序列组成的方法。对通过EFS-WEB作为文本文件提交的序列列表的引用遵照美国信息交换标准码(AmericanStandardCodeforInformationInterchange(ASCII)),通过EFS-Web将序列表的正式文本作为文本文件与本说明书同时提交,文件名为431978seqlist.txt,创建日期为2013年4月17日,文件大小为2Kb。通过EFS-Web提交的序列表是说明书的一部分,藉此将其全文以引用的方式并入本文。
技术介绍
当含有所关注的靶序列的质粒转化到植物中时,需要进行测试来确认转化已发生并且评估转化的质量。例如,当在已用相同构建体转化的多个植物中选择时,所选择的植物应具有完整的所关注靶序列,该完整靶序列没有重排、插入、缺失、或外源侧翼序列。历史上,Southern印迹方法已用于确认质粒构建体的转化并且识别潜在的重排、多拷贝、或部分事件。Southern印迹实验可为耗时的、提供低分辨率、具有高成本,并且需要多次手动检查。此外,Southern印迹方法既不能识别靶序列整合位点,也不能识别整合位点的用于设计事件特异性PCR实验的侧翼序列。侧翼序列分析(FSA)已成功地用于识别转基因整合位点并且用于获得插入位点的侧翼序列。然而,由于FSA仅针对有限的边界区域,因此FSA不检测潜在的部分片段、重排、或超出目标边界区域的截短。此外,由FSA使用的搜索算法可识别由质粒的参考序列中的任何误差造成的假阳性。因此,一直需要迅速、低成本的方法来有效地表征插入植物基因组中的靶序列的位置、数量和完整性。
技术实现思路
基于测序的Southern(SbS)是整合的高通量序列和生物信息学分析流水线,其针对大规模事件选择和推进决策而评估和表征转化事件。SbS实施一系列过滤策略来确保检测的精确度和灵敏度。通过用富集含有所关注的靶序列的片段的shotgun文库开始,SbS可迅速过滤出内源读数并且识别连接序列。连接序列被识别和延伸之后,接点被定位到植物基因组和靶序列构建体以确定插入序列的位置、数量和完整性。SbS可检测小的部分片段并且容忍质粒的参考序列中的误差。附图说明图1汇总了SbS数据分析流水线。图2示出了来自识别染色体2上的所关注靶序列的单个插入的SbS流水线的输出数据。图3a和图3b示出与靶序列片段的插入相邻的靶序列的单个插入。靶序列插入与靶序列片段插入之间的接点被识别为构建体:构建体插入,而靶序列与植物基因组或者靶序列片段与植物基因组之间的接点被识别为构建体:基因组。图4a和图4b示出复杂插入事件,其中连接序列在染色体6和染色体9上被检测到。靶序列在染色体9上的插入被复制并且处于相反方向。图5识别靶序列的截短插入,证据是其不存在与农杆菌(Agrobacterium)构建体上的靶DNA的一部分对准的读数。图6识别农杆菌骨架的一部分插入到植物的基因组中。农杆菌骨架的插入可通过读数(黑盒)与骨架的一部分的对准来识别。图7a和图7b描述了合成连接序列的方法。第一个表示出在合成步骤之前预测的推定接点。合成脚本根据相同取向中的每个接点的30_20聚体对所有接点支撑读数进行分组。对于足够接近的两个接点(默认距离2bp),如果30_20聚体在偏移距离后相同,则两个接点冷凝成一个。如图所示,两个接点为11708和11709。在被合成之后,具有更多独特支撑读数的接点(接点11708)从接点11709接管支撑读数。粗体的核苷酸表示单核苷酸多态性(SNP)并且列出的序列通过算法的分裂和合成特征来移除。具体实施方式借助前面的描述中给出的教导内容,本专利技术所属领域的技术人员将会想到本文所述的专利技术的许多修改形式和其他实施例。因此,应当理解,本专利技术不限于所公开的特定实施例,并旨在将修改形式和其他实施例包括在所附权利要求的范围内。虽然采用特定术语,但所述术语仅在一般性和描述性意义上使用而并非用于限制目的。对于商业产品批准的遗传修饰的作物的表征目前需要转基因DNA插入序列的详细分子表征和转基因基因座的完整性。此外,分子分析是产品开发过程中事件选择和推进决策的重要组成部分。已知外来基因在植物中的表达受它们在植物基因组中的位置影响,这可能归因于染色质结构(例如,异染色质)或转录调节元件(例如,增强子)接近整合位点的接近度(Weisingetal.(1988)Ann.Rev.Genet.22:421-477(Weising等人,1988年,《遗传学年评》,第22卷,第421-477页))。与此同时,转基因在基因组中不同位置处的存在将以不同方式影响植物的总体表型。此外,插入转基因的拷贝数可影响植物的表型。出于这个原因,经常需要筛选大量事件,以识别出以引入的所关注基因的最佳表达为特征的事件。例如,已经在植物及在其他生物体中观察到,在事件之间可能存在引入基因的表达水平的巨大差异。在表达的空间或时间模式方面也可以存在差异,例如,转基因在多种植物组织中相对表达方面的差异,这可能不对应于从存在于引入的基因构建体中的转录调节元件所预期的模式。因此,常见的是产生数百至数千个不同事件,并从这些事件中筛选出具有所需的转基因表达水平和用于商业目的模式的单一事件。具有所需的转基因表达水平或模式的事件可用于将转基因通过有性远交或其他常规育种方法渐掺至其他遗传背景中。此类杂交的子代维持原始转化体的转基因表达特征。使用该杂交育种策略以在充分适应于局部生长条件的众多品种中确保可靠的基因表达。通常,该分子分析依赖于Southern印迹以确定横跨任何插入DNA的PCR产物的基因座和拷贝数以及靶标序列来完成表征过程。Southern印迹的缺点包括:低通量,每个样品成本高,未知的序列组成和位置,以及检测到的DNA片段缺乏完整性。最近,通过生物信息学的下一代(NextGen)测序和连接序列分析已在成本和时间上均优于Southern印迹分析。本专利技术涉及靶序列的扩增或捕获,合并扩增或捕获的序列以及通过DNA测序对合并样品的表征。DNA序列数据被汇集并且与参考序列相比。转基因插入的表征在植物、动物、和微生物物种,人类疾病诊断、靶序列的单个或多个拷贝的基因组位置、以及纯度测试中是有用的。本专利技术进一步涉及植物的基因组中的所关注靶序列的生物信息学分析和表征的方法。当与本专利技术的新型扩增和捕获方法结合时,该表征被称为基于测序的Southern(SbS)。如本文所用,术语“基于测序的Southern”是指连续的一系列步骤,所述步骤捕获和扩增DNA,合并样品,以及分析序列数据来表征体内结构。本文所用的冠词“一个”和“一种”是指一个(种)或不止一个(种)(即,指至少一个本文档来自技高网
...

【技术保护点】
1.一种用于在植物的基因组中表征靶序列的方法,所述方法包括:/na)对包含富集的文库的样品池进行测序以获得读数,其中所述富集的文库包含植物基因组DNA,其中所述植物基因组DNA具有关注的靶序列;/nb)将所述读数过滤并且与对照植物的基因组序列以及与所述关注的靶序列比对;/nc)选择与所述关注的靶序列对齐的读数;/nd)从所述选择的读数确定连接序列;以及/ne)使用所述连接序列在所述样品植物的所述基因组中表征所述关注的靶序列的完整性。/n

【技术特征摘要】
20130417 US 61/812876;20130417 US 61/8130011.一种用于在植物的基因组中表征靶序列的方法,所述方法包括:
a)对包含富集的文库的样品池进行测序以获得读数,其中所述富集的文库包含植物基因组DNA,其中所述植物基因组DNA具有关注的靶序列;
b)将所述读数过滤并且与对照植物的基因组序列以及与所述关注的...

【专利技术属性】
技术研发人员:M贝蒂KR哈耶斯JL霍夫曼H林GM扎斯特罗哈耶斯
申请(专利权)人:先锋国际良种公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1