一种二代序列基因组重叠群的组装方法和系统技术方案

技术编号:19191192 阅读:220 留言:0更新日期:2018-10-17 03:44
本发明专利技术涉及基因组重叠群的组装方法,特别涉及一种二代序列基因组重叠群的组装方法和系统,所述方法包括如下步骤:(1)提取样品基因组并超声打断;(2)将步骤(1)超声打断的片段凝胶纯化并切胶,以构建不同插入片段的文库;(3)将步骤(2)得到的文库进行二代双末端测序;(4)将各个文库的二代双末端测序的读1和读2进行拼接;(5)将拼接后的序列进行序列组装;其中,所述二代双末端测序的读1和读2的序列有5bp以上的重叠区域。本发明专利技术方法和系统通过实验建库、根据测序读长选取建库和切胶范围,并结合拼接软件进行拼接,达到了延长序列读长的目的,用延长后的序列根据重叠关系进行重叠群组装,达到提高重叠群组装的指标和准确性。

【技术实现步骤摘要】
一种二代序列基因组重叠群的组装方法和系统
本专利技术涉及生物
,具体涉及基因组重叠群的组装方法,特别涉及一种二代序列基因组重叠群的组装方法和系统。
技术介绍
罗氏454测序系统的测序原理是基于焦磷酸测序法,依靠生物发光对DNA序列进行检测,在DNA聚合酶,ATP硫酸化酶,荧光素酶和双磷酸酶的协同作用下,罗氏454测序系统将引物上每一个dNTP的聚合与一次荧光信号释放偶联起来。通过检测荧光信号释放的有无和强度,就可以达到实时测定DNA序列的目的。此技术不需要荧光标记的引物或核酸探针,也不需要进行电泳,具有分析结果快速、准确、高灵敏度和高自动化的特点。罗氏454测序序列平均长度一般为500bp左右,最长为700bp左右,其长度相对于目前二代测序Hiseq2500的250bp和Miseq的300bp来说要长的多,但其在2016年年中已经停止服务。目前基因组组装项目以全基因组鸟枪法测序(Whole-genomeshotgunsequencing,WGS)为主流设计方案,WGS是一种分析大片段基因组DNA序列的策略,将大片段DNA(如噬菌体文库中约40kb长或细菌人工染色体所含350kb本文档来自技高网...

【技术保护点】
1.一种二代序列基因组重叠群的组装方法,其特征在于,包括如下步骤:(1)提取样品基因组并超声打断;(2)将步骤(1)超声打断的片段凝胶纯化并切胶,以构建不同插入片段的文库;(3)将步骤(2)得到的文库进行二代双末端测序;(4)将各个文库的二代双末端测序的读1和读2进行拼接;(5)将拼接后的序列进行序列组装;其中,所述二代双末端测序的读1和读2的序列有5bp以上的重叠区域。

【技术特征摘要】
1.一种二代序列基因组重叠群的组装方法,其特征在于,包括如下步骤:(1)提取样品基因组并超声打断;(2)将步骤(1)超声打断的片段凝胶纯化并切胶,以构建不同插入片段的文库;(3)将步骤(2)得到的文库进行二代双末端测序;(4)将各个文库的二代双末端测序的读1和读2进行拼接;(5)将拼接后的序列进行序列组装;其中,所述二代双末端测序的读1和读2的序列有5bp以上的重叠区域。2.根据权利要求1所述的组装方法,其特征在于,步骤(1)所述超声打断的范围为100-500bp,步骤(2)所述切胶的长度范围为450-500bp;优选地,步骤(1)所述超声打断的范围为100-600bp,步骤(2)所述切胶的长度范围为550-600bp。3.根据权利要求1或2所述的组装方法,其特征在于,所述二代双末端测序的读1和读2的读长长度为200-2000bp,优选为200-500bp,进一步优选为250-300bp。4.根据权利要求1-3中任一项所述的组装方法,其特征在于,所述二代双末端测序的读1和读2的序列有5bp以上的重叠区域。5.根据权利要求1-4中任一项所述的组装方法,其特征在于,所述步骤(3)和步骤(4)之间还包括将步骤(3)所述的二代双末端测序进行数据过滤。6.根据权利要求1-5中任一项所述的组装方法,其特征在于,所述数据过滤具体包括:去除含接头和低质量的序列。7.根据权利要求1-6中任一项所述的组装方法,其特征在...

【专利技术属性】
技术研发人员:邓天全高强杨林峰杨鑫盛琴陈世璇岳震霍守江肖黎
申请(专利权)人:深圳华大基因科技服务有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1