一种细菌pdif快速注释方法及装置制造方法及图纸

技术编号:27255773 阅读:18 留言:0更新日期:2021-02-04 12:35
本发明专利技术公开了一种细菌pdif快速注释方法及装置,构建pdifDB数据库;通过全基因组测序得到待分析的细菌DNA序列;通过BLASTN将所述细菌DNA序列与所述pdifDB数据库中的pdif序列进行比对,获得细菌DNA序列中的pdif序列注释结果。该方法对快速发现细菌DNA序列中的pdif序列,明确细菌中由pdif介导的耐药基因转移机制意义重大。制意义重大。

【技术实现步骤摘要】
一种细菌pdif快速注释方法及装置


[0001]本专利技术涉及细菌DNA序列注释领域,主要为一种细菌pdif序列快速注释方法及装置,可用于分析细菌DNA序列中pdif的有无以及在细菌DNA序列中的位置。

技术介绍

[0002]近年来,全基因组测序技术(Whole genome sequencing,WGS)发展迅速。此外,测序成本的降低增加了其在实验室进行快速细菌WGS的可能性。WGS的最大优势是在得到测序结果并组装后,可以通过基于网站以及命令行的工具快速注释并预测细菌的耐药基因、移动元件等,极大地加速了细菌分子特征和流行病学监测领域的研究进程。
[0003]细菌耐药是全球面临的重大公共卫生问题。耐药菌的广泛流行,给感染性疾病的治疗带来极大挑战。细菌之间可以通过移动元件进行种内/种间耐药性的传播。了解与细菌耐药性相关的移动元件的转移对明确细菌之间耐药性的传播至关重要。现如今,主要报道的移动元件有插入序列(Insertion sequence,IS),整合子(Integron,In)和转座子(Transposon,Tn)等。最近几年,XerCD-dif位点特异性重组系统被认为是可介导耐药基因转移的另一途径,尤其在鲍曼不动杆菌中发现较多,逐渐成为研究的热点,但具体的机制仍未明。许多细菌编码两种同源重组酶蛋白,通常成对出现,分别称为XerC/XerD。XerC/XerD属于酪氨酸重组酶家族,可以催化两对连续的DNA链进行切割,并在一个位于染色体末端区域内的限定位点dif进行交换。通常,dif位点长度为28bp,两端分别为两个11bp反向重复的Xer结合区构成,中心区域为6bp的间隔区。XerC和XerD的一个单体各自结合到11bp的半结合位点,XerC结合在左侧位点,而XerD结合在右侧位点。然而,存在于质粒上的dif位点称为pdif,一个质粒上可以存在多个pdif位点,甚至可达16个。目前已经发现多个重要的耐药基因存在于pdif位点之间,如:bla
OXA-24
,bla
OXA-58
,bla
OXA-72
,tet39等。这些pdif位点可以介导耐药基因在同一个质粒内部以及不同质粒之间发生转移,尤其在鲍曼不动杆菌耐药性的传播中起着至关重要的作用。然而,目前尚无与重要的pdif位点识别相关的注释方法。因此,对pdif位点的识别以及进一步研究其携带耐药基因共转移的机制,对控制临床上耐药细菌的传播意义重大。

技术实现思路

[0004]本专利技术的目的是提供一种细菌pdif序列快速注释方法及装置,以解决目前尚无pdif位点序列相关的注释方法的问题。
[0005]为了达到上述目的,本专利技术将采用以下技术方案:
[0006]第一方面,本专利技术将提供一种细菌pdif快速注释方法,包括:
[0007]构建pdifDB数据库;
[0008]通过全基因组测序得到待分析的细菌DNA序列;
[0009]通过BLASTN将所述细菌DNA序列与所述pdifDB数据库中的pdif序列进行比对,获得细菌DNA序列中的pdif序列注释结果。
[0010]进一步地,构建pdifDB数据库,包括:
[0011]从NCBI上质粒Genbank文件里提取并建立pdifDB数据库。
[0012]进一步地,还包括:
[0013]将所述pdif序列注释结果以表格以及图形化形式输出。
[0014]进一步地,所述图形化中展示的内容包括pdif的数量和pdif在细菌DNA序列中的具体位置。
[0015]进一步地,所述细菌DNA序列的格式为Fasta或Genbank格式。
[0016]第二方面,本专利技术将提供一种细菌pdif快速注释装置,包括:
[0017]数据库构建模块,用于构建pdifDB数据库;
[0018]获取模块,用于通过全基因组测序获取待分析的细菌DNA序列;
[0019]比对模块,用于通过BLASTN将所述细菌DNA序列与所述pdifDB数据库中的pdif序列进行比对,获得细菌DNA序列中的pdif序列注释结果。
[0020]通过以上技术方案,本专利技术的有益效果如下:首先,本专利技术提供了一种细菌pdif序列快速注释方法及装置,只需要简单地递交序列,就可以对细菌DNA中的pdif序列的数量和位置进行注释。同时,用户可以根据需要自行下载注释后的相关文件,解决了目前尚无pdif序列识别相关的注释网站的问题。使用者只需要上传细菌的DNA序列,递交后就可以在极短时间内得到细菌的pdif序列数量和位置相关信息,并可以进一步以图形的形式进行可视化。本方法学的建立将对研究细菌中由pdif序列引起的耐药基因的转移机制有着重要的意义。
附图说明
[0021]此附图将对本专利技术的进一步理解提供帮助,是本专利技术的一部分,本专利技术的示意图及相关说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0022]图1为本专利技术实施例提供的一种细菌pdif序列快速注释方法的流程图;
[0023]图2为本专利技术实施例中鲍曼不动杆菌pdif序列注释主界面;
[0024]图3a为本专利技术实施例中鲍曼不动杆菌255_n基因组序列分析后的pdif位点结果示意图;
[0025]图3b为本专利技术实施例中鲍曼不动杆菌255_n基因组比对片段序列信息的可视化示意图;
[0026]图4为本专利技术实施例中提供的一种细菌pdif序列快速注释装置的框图。
具体实施方式
[0027]为了使申请的目的和技术方案更加详细、清楚,下面将结合具体的实施例及附图进行描述。此外,实施例只是本申请的一部分,不是全部。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0028]图1为本专利技术实施例提供的一种细菌pdif快速注释方法的流程图;本实施例的一种细菌pdif快速注释方法,主要包括以下步骤:
[0029]步骤S101,构建pdifDB数据库;
[0030]具体地,从美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)上质粒Genbank文件里的注释提取并建立pdifDB数据库。进一步地,从NCBI上质粒Genbank文件里的注释提取41个pdif序列至pdifDB数据库。
[0031]步骤S102,通过全基因组测序得到待分析的细菌DNA序列或直接从NCBI上下载完整的拼接好的细菌DNA序列;
[0032]具体地,通过全基因组测序获得想要分析的并完成拼接的序列或从NCBI数据库中下载的已经拼接完成的序列,序列的格式可以是Fasta或Genbank格式,这两种格式是DNA序列中最常见的格式。
[0033]步骤S103,利用基于局部比对算法的搜索工具(Basic Local Alignment Search Tool,BLAST)将细菌DNA序列与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种细菌pdif快速注释方法,其特征在于,包括:构建pdifDB数据库;通过全基因组测序得到待分析的细菌DNA序列;通过BLASTN将所述细菌DNA序列与所述pdifDB数据库中的pdif序列进行比对,获得细菌DNA序列中的pdif序列注释结果。2.根据权利要求1所述的一种细菌pdif快速注释方法,其特征在于,构建pdifDB数据库,包括:从NCBI上质粒Genbank文件里提取并建立pdifDB数据库。3.根据权利要求1所述的一种细菌pdif快速注释方法,其特征在于,还包括:将所述pdif序列注释结果以表格以及图形化形式输出。4.根据权利要求3所述的一种细菌pdif快速注释方法,其特征在于,所述图形化中展示的内容包括pdif的数量和pdif在细菌DNA序列中的具体位置。5.根据权利要求1所述的一种细菌pdif快速注释方法,其特征在于,所述细菌DNA序列的格式为Fasta或Genbank格式。6.一种细菌pdif快速注释装置,其特...

【专利技术属性】
技术研发人员:华孝挺俞云松刘海洋娄永锋
申请(专利权)人:杭州微数生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1