一种基于序列组分和移动元件的基因组岛预测方法及系统技术方案

技术编号:43220037 阅读:27 留言:0更新日期:2024-11-05 17:12
本发明专利技术公开了一种基于序列组分和移动元件的基因组岛预测方法及系统。本发明专利技术包括以下步骤:首先从移动元件数据库中获取移动元件的生物信息;接着利用基于序列组分的预测方法生成待检测的基因组序列的初始候选基因组岛集合;然后根据待检测的基因组序列,结合移动元件的包含性对候选基因组岛集合进行第一次过滤;再利用滑动窗口的包含性基因组岛进行补救,最后再次利用移动元件对于候选基因组岛进行第二次过滤从而形成最终的基因组岛集合。本发明专利技术在移动元件数据库中得到每一种移动元件的生物信息后,在基于组分的识别方法基础上,发现移动元件后构建基因组岛二次识别方法,提高基因组岛的预测效率。

【技术实现步骤摘要】

本专利技术涉及了一种基因组岛预测方法,具体涉及了一种基于序列组分和移动元件的基因组岛预测方法及系统


技术介绍

1、基因组岛是携带与环境适应和生物进化密切相关功能基因的大片段,在水平基因转移中与受体基因组序列不同。通过序列组成分析可以识别这些异常区域。研究基因组岛有助于理解微生物进化和适应机制,揭示基因水平转移的模式,对抗生素耐药性和病原菌毒力因子的研究具有重要意义。

2、通过分析基因组岛内的gc含量、密码子偏好性、开放阅读框(orf)和k-mer等信息,许多基于序列组分的基因组岛方法被陆续提出。这些方法利用不同的序列特征和统计方法来识别基因组中的异常区域,从而检测出潜在的基因组岛。目前,已有多种基于序列组成的识别方法被广泛应用于基因组岛的检测和分析,主要包括以下八种方法:

3、alien_hunter:通过检测基因组中异常的gc含量和密码子使用模式来识别基因组岛。

4、centroid:采用聚类方法,根据序列特征的相似性来识别基因组岛。

5、indegenius:利用隐马尔可夫模型(hmm)结合序列特征来检本文档来自技高网...

【技术保护点】

1.一种基于序列组分和移动元件的基因组岛预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于序列组分和移动元件的基因组岛预测方法,其特征在于,所述S2中,基于序列组分的预测方法的数量为一种或者多种。

3.根据权利要求2所述的一种基于序列组分和移动元件的基因组岛预测方法,其特征在于,若采用多种所述基于序列组分的预测方法,则在预测获得候选基因组岛中去除重复的候选基因组岛,从而获得基因组序列的初始候选基因组岛集合。

4.根据权利要求1所述的一种基于序列组分和移动元件的基因组岛预测方法,其特征在于,所述S3中,基于移动元件的生物信息整理候选基...

【技术特征摘要】

1.一种基于序列组分和移动元件的基因组岛预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于序列组分和移动元件的基因组岛预测方法,其特征在于,所述s2中,基于序列组分的预测方法的数量为一种或者多种。

3.根据权利要求2所述的一种基于序列组分和移动元件的基因组岛预测方法,其特征在于,若采用多种所述基于序列组分的预测方法,则在预测获得候选基因组岛中去除重复的候选基因组岛,从而获得基因组序列的初始候选基因组岛集合。

4.根据权利要求1所述的一种基于序列组分和移动元件的基因组岛预测方法,其特征在于,所述s3中,基于移动元件的生物信息整理候选基因组岛的移动元件确定候选基因组岛中是否包含移动元件,从而确定是否删除该候选基因组岛。

【专利技术属性】
技术研发人员:代琦钱烨孔瑞刘晓庆
申请(专利权)人:浙江理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1