一种分析水平基因转移断点周围基因的方法技术

技术编号:37863768 阅读:27 留言:0更新日期:2023-06-15 20:53
本发明专利技术公开了基因转移技术领域的一种分析水平基因转移断点周围基因的方法,包括以下步骤:S1:利用文本挖掘将水平基因转移断点周围基因进行功能分类;S2:在UHGG数据库(人类肠道微生物基因组集)中获取相关基因的KO标识符;S3:对上述收集的KO标识符进行基因通路富集分析,本发明专利技术创造技术方案能够低成本、高效率地分析水平基因转移断点的周围基因,且操作简单,进行统计检验后能够返回显著富集的功能基因集。除此之外,本发明专利技术创造技术方案能够将水平基因转移断点周围基因分析到具体的代谢网络中的指定位置,准确定义了基因和代谢物之间复杂的相互关系,同时,人工注释的多张网状的代谢通路与其他树状的结构相比不存在冗余。的代谢通路与其他树状的结构相比不存在冗余。的代谢通路与其他树状的结构相比不存在冗余。

【技术实现步骤摘要】
一种分析水平基因转移断点周围基因的方法


[0001]本专利技术涉及基因转移
,具体为一种分析水平基因转移断点周围基因的方法。

技术介绍

[0002]水平基因转移对微生物有着重要作用。当前对水平基因转移分析,依赖现有的组装序列,分析序列特征后,直接推断转移的基因序列。之后再对转移的基因序列进行分析。
[0003]这种方法依赖已有的组装序列,难以进行个性化的水平基因转移分析,也无法进行大规模的研究。本专利技术提出了一种大规模分析水平基因转移断点周围基因的方法。
[0004]为此,我们提出一种分析水平基因转移断点周围基因的方法。

技术实现思路

[0005]本专利技术的目的在于提供一种分析水平基因转移断点周围基因的方法,以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:一种分析水平基因转移断点周围基因的方法,包括以下步骤:
[0007]S1:利用文本挖掘将水平基因转移断点周围基因进行功能分类;
[0008]S2:在UHGG数据库(人类肠道微生物基因组集本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种分析水平基因转移断点周围基因的方法,其特征在于:包括以下步骤:S1:利用文本挖掘将水平基因转移断点周围基因进行功能分类;S2:在UHGG数据库(人类肠道微生物基因组集)中获取相关基因的KO标识符;S3:对上述收集的KO标识符进行基因通路富集分析。2.根据权利要求1所述的一种分析水平基因转移断点周围基因的方法,其特征在于:所述S1中HGT相关基因是指位于HGT断点100bp内的基因,利用UHGG的注释文件进行基因定位,选择与间隔重叠的基因作为HGT相关基因。3.根据权利要求2所述的一种分析水平基因转移断点周围基因的方法,其特征在于:所述S1中为了分析相关基因中除“功能未知外”其余基因的具体功能类别以及各种类别的比例,需要将HGT断点周围相关基因进行分类。4.根据权利要求3所述的一种分析水平基因转移断点周围基因的方法,其特征在于:相关基因分类包括以下步骤:S1:扫描并检查每一个断点100bp内的间隔;S2:再利用文本挖掘的方式实现相关基因的分类;S3:在获取到基因数据后,首先对基因数据进行预处理;S4:然后针对处理后的数据进行分析及挖掘;S5:通过UHGG数据库中记录的相关基因功能描述中的关键词搜索进行赋值并将基因归入转座子类别;S6:最终将HGT相关基因分为CaZ、噬菌体、质粒、转座子、抗生素耐药性。5.根据权利要求1所述的一种分析水平基因转移断点周围基因的方法,其特征在于:所述S2中KO标识符为KEGG中的基...

【专利技术属性】
技术研发人员:赵梓丞贺小兰高鹏
申请(专利权)人:深圳百人科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1