【技术实现步骤摘要】
一种基于二代和三代ONT技术进行宏基因组组装方法
本专利技术属于生物学
,尤其涉及一种基于二代和三代ONT技术进行宏基因组组装方法。
技术介绍
宏基因组学避开纯培养技术探知微生物的多样性及其功能,为我们提供了一种发现新基因、开发新的微生物活性物质和研究微生物群落结构及其功能的新技术。二代测序具有高质量的数据、较低的样品需求以及简单的操作流程等优点,但是读长短,扩增存在偏好性,为组装带来了很大的挑战。三代ONT测序实现了读长长,同时也降低了测序成本,但测序不够精准,三代ONT与二代结合将很大程度提高组装长度。
技术实现思路
为克服上述现有问题或者至少部分地解决上述问题,本专利技术实施例提供一种基于二代和三代ONT技术进行宏基因组组装方法。本专利技术实施例提供了一种基于二代和三代ONT技术进行宏基因组组装方法,包括:利用三代ONT测序的reads进行自身比对,找到不同数据间的重叠部分overlap;根据不同数据间的重叠部分overlap对不同数据进行组装,得到组装后的数据; >利用三代数据对所述本文档来自技高网...
【技术保护点】
1.一种基于二代和三代ONT技术进行宏基因组组装方法,其特征在于,包括:/n利用三代ONT测序的reads进行自身比对,找到不同数据间的重叠部分overlap;/n根据不同数据间的重叠部分overlap对不同数据进行组装,得到组装后的数据;/n利用三代数据对所述组装后的数据进行自身纠错;/n利用二代测序继续进行纠错,得到最终的组装结果。/n
【技术特征摘要】
1.一种基于二代和三代ONT技术进行宏基因组组装方法,其特征在于,包括:
利用三代ONT测序的reads进行自身比对,找到不同数据间的重叠部分overlap;
根据不同数据间的重叠部分overlap对不同数据进行组装,得到组装后的数据;
利用三代数据对所述组装后的数据进行自身纠错;
利用二代测序继续进行纠错,得到最终的组装结果。
2.根据权利要求1所述的组装方法,其特征在于,所述利用三代ONT测序的reads进行自身比对,找到不同数据间的重叠部分overlap包括:
利用minimap2软件通过将测序数据分成多个k长度的kmer组;
采用minimizers方法从多个相邻的kmers组里挑选出z值最小的两个kmer组;
如果两个kmer组序列间具有overlap重叠部分,则这两个序列为具有相同的代表性kmer;
通过使用单链聚类的方法使具有共线性的minimizers为一组kmer;
通过求解最长递增序列问题得到最大的共线性minimizers子集,即minimap的map结果。
3.根据权利要求1所述的组装方法,其特征在于,所述根据不同数据间的重叠部分overlap对不同数据进行组装,得到组装后的数据包括:
利用miniasm-master软件通过检查read之间的映射关系,并去除接头和嵌合体;
基于与其他所有reads之间满足预设条件映射关系的每一条read,计算所述read的每一个碱基覆盖度,选择覆盖度不小于3的最长区域;
修剪过reads后,通过分析存在overlap的两条序列之间的map关系构建组装图;
利用miniasm方法去除transitiveedges,修剪包含少于4个reads的unitigs,弹出小气泡;
将相邻的多个组装图串联合并成一个uni...
【专利技术属性】
技术研发人员:郑洪坤,龚雪情,王凡,
申请(专利权)人:北京百迈客生物科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。