【技术实现步骤摘要】
一种细菌DNA序列快速注释方法及装置
本专利技术涉及细菌DNA序列注释领域,尤其涉及一种细菌DNA序列快速注释方法及装置,主要应用于分析DNA系列的耐药基因组、插入元件、整合子和转座子的情况。
技术介绍
近年来,高通量基因组测序(NGS)技术取得了快速的发展,大大降低了细菌基因组的测序费用,增加在临床微生物实验室进行快速细菌全基因组测序的可能性。NGS最大的优势之一是能够预测多种细菌中的耐药基因和移动元件,加速了对细菌分子特征和流行病学监测领域的研究进程。短时间内,大量的细菌基因组被测序,基因组释放的数量呈指数上升。尽管大多基因组并不完整,但是它们还是被释放到公共领域,同时它们的注释依赖于自动注释流程。目前,为了方便对细菌基因组进行研究,高效的注释方法正不断被开发。RapidAnnotationusingSubsystemTechnology(RAST)是其中广为应用的细菌基因组注释服务器。RAST先预测开放阅读框,然后进行注释。同时RAST也支持在SEED环境下进行比较基因组分析。尽管RAST已被广泛使用,但是RA ...
【技术保护点】
1.一种细菌DNA序列快速注释方法,其特征在于,包括:/n分别构建ResDB、ISDB、IntegronDB和TransposonDB数据库;/n获取待分析的细菌DNA序列;/n利用BLASTN程序将待分析的细菌DNA序列与ResDB、ISDB、IntegronDB和TransposonDB数据库中的一个或多个进行比对;/n根据比对的覆盖率和一致性,获得最佳匹配基因和最佳匹配基因对应的查询基因的比对片段序列信息,并输出注释结果。/n
【技术特征摘要】
1.一种细菌DNA序列快速注释方法,其特征在于,包括:
分别构建ResDB、ISDB、IntegronDB和TransposonDB数据库;
获取待分析的细菌DNA序列;
利用BLASTN程序将待分析的细菌DNA序列与ResDB、ISDB、IntegronDB和TransposonDB数据库中的一个或多个进行比对;
根据比对的覆盖率和一致性,获得最佳匹配基因和最佳匹配基因对应的查询基因的比对片段序列信息,并输出注释结果。
2.根据权利要求1所述的一种细菌DNA序列快速注释方法,其特征在于,分别构建ResDB、ISDB、IntegronDB和TransposonDB数据库,包括:
从NCBI下载NCBI细菌耐药基因ResDB参考数据库,从ISFINDER下载ISDB数据库,从INTERGRALL下载IntegronDB数据库,从TheTransposonRegistry下载TransposonDB数据库。
3.根据权利要求1所述的一种细菌DNA序列快速注释方法,其特征在于,对输出的注释结果进行可视化展示。
4.根据权利要求1所述的一种细菌DNA序列快速注释方法,其特征在于,可视化展示的内容包括四个数据库的基因类型、基因方向、基因数量和基因位置。
5.根据权利要求1所述的一种细菌DNA序列快速注释方法,其特征在于,所述的细菌DNA序列为Fasta或Genbank格式的序列文件,其中Fasta格式的序列文件载入参数为--nucleotide,Genbank格式的序列文件载入参数为--genbank,Fasta或Genbank格式的序列文件均还包括以下参数设置:
输出文件所在目录:--resultdir;参考数据库:--databases;匹配序列的最小覆盖率:--coverage;匹配序列的最小一致性:--identity。
6.根据权利要求1所述的一种细菌DNA序列快速注释方法,其特征在于,比对结果包括:...
【专利技术属性】
技术研发人员:华孝挺,俞云松,陈欢,梁倩,洪文杰,何锦涛,张玲虹,
申请(专利权)人:浙江大学,浙江天科高新技术发展有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。