一种细菌中功能性前噬菌体及其位置与序列的检测方法技术

技术编号:24942060 阅读:21 留言:0更新日期:2020-07-17 21:51
本发明专利技术公开了一种细菌中功能性前噬菌体及其位置与序列的检测方法。本发明专利技术公开的细菌中功能性前噬菌体的检测方法包括:预测待测细菌基因组测序数据中的开放阅读框,得到开放阅读框编码的蛋白质,将该蛋白质序列与噬菌体蛋白质库中序列进行比对,能与噬菌体蛋白质比对上的蛋白质为功能性蛋白质,在功能蛋白质的编码基因及其上下游查找正向重复序列,两条互为正向重复序列间的序列为候选前噬菌体的候选序列,连接候选序列首尾,测序数据中含有跨越候选序列首尾连接处的测序读长的候选前噬菌体为功能性噬菌体;测序数据中不含跨越候选序列首尾连接处的测序读长的候选前噬菌体不为功能性噬菌体。本发明专利技术的方法操作简便,应用前景广泛。

【技术实现步骤摘要】
一种细菌中功能性前噬菌体及其位置与序列的检测方法
本专利技术涉及生物
中,一种细菌中功能性前噬菌体及其位置与序列的检测方法。
技术介绍
噬菌体,是一种感染细菌的病毒,并在宿主体内发挥重要的生物学作用。它们能够被分为两类:裂解性噬菌体和溶原性噬菌体。溶原性噬菌体是一种能够将自身基因整合进细菌基因组中的病毒,在整合过程中,溶原性噬菌体能够将它的基因插入细菌基因组中(溶原性噬菌体整合进细菌基因组后称为前噬菌体)或者以质粒的形式存在细菌细胞质中。前噬菌体作为噬菌体的一种重要存在形式,在原核生物进化中扮演着重要角色,也是细菌基因组多样化的驱动力。在前噬菌体整合到细菌的过程中,能够改变宿主的基因表达并破坏细菌原基因组,通过毒力基因和耐药基因等的水平转移,导致细菌表型改变。例如德国发现的肠出血性大肠杆菌O104:H4的主要毒力基因由前噬菌体所编码。霍乱弧菌的霍乱毒素基因是由丝状功能性前噬菌体CTXφ编码的。前噬菌体包括功能性前噬菌体(functionalprophage)和隐匿性前噬菌体(crypticprophage)。功能性前噬菌体指在特定条件诱导后仍然具有裂解作用的前噬菌体。隐匿性前噬菌体又称前噬菌体样元件(prophagegenomeelements),因其产生突变而不能进行裂解。由于只有功能性前噬菌体才能够裂解并感染细菌(隐匿性前噬菌体已丧失裂解功能)。当功能性前噬菌体被从宿主菌中诱导出来后,即为溶原性噬菌体。只有在获得了完整的功能性前噬菌体序列的基础上,才能更深刻、更系统的去理解噬菌体-细菌相互作用关系,进一步深入的进行细菌耐药相关研究。另一方面,由于细菌耐药问题的严重性,裂解性噬菌体因其具有杀灭耐药菌的能力,近年来得到越来越广泛的研究。为了安全地使用裂解性噬菌体,仔细的检查并排除功能性前噬菌体是非常重要的。一般而言,裂解性噬菌体的分离纯化是通过挑取合适的噬菌斑实现的。如果整合在细菌中的功能性前噬菌体进入裂解周期,则极易混合在挑选的裂解性噬菌体中。当使用含有已诱导的功能性前噬菌体(即溶原性噬菌体)的裂解性噬菌体进行杀菌时,其中的溶原性噬菌体很可能又再次整合到细菌中,将自身含有的毒力因子和耐药因子水平转移到细菌基因组中,导致未被杀灭的细菌获得新的毒力/致病性引起表型改变,反而加速了该宿主菌的进化变异和适应性。因此,更好地理解功能性前噬菌体,会帮助人们理解细菌的致病性和特殊的代谢途径,以及安全的进行裂解性噬菌体生产。传统方法需要通过对前噬菌体的诱导分离来鉴定细菌中是否含有功能性前噬菌体。在生物实验中,通过照射紫外线或者加入丝裂霉素等化学物质破坏宿主菌的DNA,促使功能性前噬菌体从宿主菌中分离出来,然后通过双层琼脂板分离这些已诱导的功能性前噬菌体(即溶原性噬菌体),对其进行扩增培养,并转染到不同菌株中,观察噬菌斑并挑取克隆,从而进行噬菌体特性分析和噬菌体-细菌相互关系研究。值得注意的是,由于溶原性噬菌体的溶原特点(即将自身基因组整合到细菌基因组中),即便是在其被诱导成功后,在进行细菌转染的过程中,也极易与宿主菌进行重组、整合,再次进入溶原状态,从而无法观察到噬菌斑。因此,溶原性噬菌体的溶原特点导致其诱导过程非常艰难并且低效。高通量测序技术的发展,使得人们在很短的时间内能够得到海量的细菌基因组序列,也使得借助计算机算法对细菌序列中的前噬菌体进行预测成为可能。然而,前噬菌体自身在科(family)分类水平上的低相似性,以及在整合到细菌基因组过程中带来的前噬菌体基因大小的不确定性,一直制约着前噬菌体的有效预测,在计算上非常具有挑战性。早期确定前噬菌体的方法通常基于计算不同GC含量或鉴定缺损基因,但上述此类简单计算方法得出的预测结果非常不可靠。在2000年代后期,出现了一批改进后的计算程序和服务网站,帮助预测细菌基因组中的前噬菌体。这些方法首先将输入序列和已知的噬菌体和细菌基因进行比对,进行tRNA和二核苷酸分析,并使用隐马尔科夫模型预测结合位点。上述方法极大的提高了前噬菌体预测的准确性,并促进了更多前噬菌体预测工具的开发,包括不依赖于已知噬菌体序列、面向宏基因组测序数据的前噬菌体预测软件。PHAST系列是目前使用较为广泛的前噬菌体预测服务网站。这类基于互联网的应用程序限制了它们的使用通量,并且在使用高峰期时对用户的响应时间过长,影响了前噬菌体预测效率;此外用户(例如各类微生物研究所)在产生大量细菌基因组数据后,将其全部上传到网站上进行分析,显然是不现实的。另外,上述工具从一个细菌基因组中能够预测出很多前噬菌体序列。但是通过生物实验验证,发现这些工具预测出的很多前噬菌体都无法进行诱导;而个别能够诱导出的功能性前噬菌体与之前的预测结果大相径庭,存在预测位置偏差、无法准确预测出功能性前噬菌体的情况。因此,这些工具中没有一个能预测功能性前噬菌体的精确位置。另外,它们也不能自动从细菌基因组中提取出完整的功能性前噬菌体基因组序列。
技术实现思路
本专利技术所要解决的技术问题是如何准确检测细菌中功能性前噬菌体及其位置与序列。为解决上述技术问题,本专利技术首先提供了一种细菌中功能性前噬菌体/溶原性噬菌体的检测方法,所述方法包括:(1)对待测细菌基因组进行高通量测序,得到测序数据;所述待测细菌含有噬菌体;(2)预测所述测序数据中的开放阅读框,得到所述开放阅读框编码的蛋白质,将其记为候选蛋白质;(3)将所述候选蛋白质的序列与噬菌体蛋白质库中序列进行比对,能与噬菌体蛋白质比对上的候选蛋白质为功能性蛋白质,不能与噬菌体蛋白质比对上的候选蛋白质为非功能性蛋白质;所述功能蛋白质的编码基因在所述待测细菌基因组中的位置为候选前噬菌体所处的位置,将该位置记为粗略位置;(4)在所述粗略位置及其上下游采用滑动窗口方法查找正向重复序列,所述正向重复序列是指溶原性噬菌体整合进细菌基因组后所形成的前噬菌体序列两端的正向重复序列;所述采用滑动窗口方法包括:在所述粗略位置及其上下游定义两个长度均为n的滑动窗口,n为50bp,两个滑动窗口间的距离为10,000bp,比对两个滑动窗口的序列,确定两个滑动窗口中是否存在互为正向重复序列,如两个滑动窗口中不存在互为正向重复序列,则将两个滑动窗口延序列的上下游滑动以确定所述粗略位置及其上下游是否存在正向重复序列;将含有所述功能蛋白质的编码基因的两条互为正向重复序列间的序列记为所述候选前噬菌体的候选序列,将所述候选序列在所述待测细菌基因组中的位置记为所述候选前噬菌体的候选位置;(5)连接所述候选序列首尾,得到环状序列;根据如下方法确定所述候选前噬菌体是否为功能性前噬菌体:所述测序数据中含有跨越所述候选序列首尾连接处的测序读长(reads),所述候选前噬菌体为或候选为功能性噬菌体;所述测序数据中不含跨越所述候选序列首尾连接处的测序读长(reads),所述候选前噬菌体不为或候选不为功能性噬菌体。本专利技术还提供了一种细菌基因组中前噬菌体位置的检测方法,所述方法包括:(1)对待测细菌基因组进行高通量测序,得到测序数据;所述待测细菌含有本文档来自技高网
...

【技术保护点】
1.一种细菌中功能性前噬菌体的检测方法,包括:/n(1)对待测细菌基因组进行高通量测序,得到测序数据;所述待测细菌含有噬菌体;/n(2)预测所述测序数据中的开放阅读框,得到所述开放阅读框编码的蛋白质,将其记为候选蛋白质;/n(3)将所述候选蛋白质的序列与噬菌体蛋白质库中序列进行比对,能与噬菌体蛋白质比对上的候选蛋白质为功能性蛋白质,不能与噬菌体蛋白质比对上的候选蛋白质为非功能性蛋白质;所述功能蛋白质的编码基因在所述待测细菌基因组中的位置为候选前噬菌体所处的位置,将该位置记为粗略位置;/n(4)在所述粗略位置及其上下游采用滑动窗口方法查找正向重复序列,所述正向重复序列是指溶原性噬菌体整合进细菌基因组后所形成的前噬菌体序列两端的正向重复序列;所述采用滑动窗口方法包括:在所述粗略位置及其上下游定义两个长度均为n的滑动窗口,n为50bp,两个滑动窗口间的距离为10,000bp,比对两个滑动窗口的序列,确定两个滑动窗口中是否存在互为正向重复序列,如两个滑动窗口中不存在互为正向重复序列,则将两个滑动窗口延序列的上下游滑动以确定所述粗略位置及其上下游是否存在正向重复序列;/n将含有所述功能蛋白质的编码基因的两条互为正向重复序列间的序列记为所述候选前噬菌体的候选序列,将所述候选序列在所述待测细菌基因组中的位置记为所述候选前噬菌体的候选位置;/n(5)连接所述候选序列首尾,得到环状序列;根据如下方法确定所述候选前噬菌体是否为功能性前噬菌体:所述测序数据中含有跨越所述候选序列首尾连接处的测序读长,所述候选前噬菌体为或候选为功能性噬菌体;所述测序数据中不含跨越所述候选序列首尾连接处的测序读长,所述候选前噬菌体不为或候选不为功能性噬菌体。/n...

【技术特征摘要】
1.一种细菌中功能性前噬菌体的检测方法,包括:
(1)对待测细菌基因组进行高通量测序,得到测序数据;所述待测细菌含有噬菌体;
(2)预测所述测序数据中的开放阅读框,得到所述开放阅读框编码的蛋白质,将其记为候选蛋白质;
(3)将所述候选蛋白质的序列与噬菌体蛋白质库中序列进行比对,能与噬菌体蛋白质比对上的候选蛋白质为功能性蛋白质,不能与噬菌体蛋白质比对上的候选蛋白质为非功能性蛋白质;所述功能蛋白质的编码基因在所述待测细菌基因组中的位置为候选前噬菌体所处的位置,将该位置记为粗略位置;
(4)在所述粗略位置及其上下游采用滑动窗口方法查找正向重复序列,所述正向重复序列是指溶原性噬菌体整合进细菌基因组后所形成的前噬菌体序列两端的正向重复序列;所述采用滑动窗口方法包括:在所述粗略位置及其上下游定义两个长度均为n的滑动窗口,n为50bp,两个滑动窗口间的距离为10,000bp,比对两个滑动窗口的序列,确定两个滑动窗口中是否存在互为正向重复序列,如两个滑动窗口中不存在互为正向重复序列,则将两个滑动窗口延序列的上下游滑动以确定所述粗略位置及其上下游是否存在正向重复序列;
将含有所述功能蛋白质的编码基因的两条互为正向重复序列间的序列记为所述候选前噬菌体的候选序列,将所述候选序列在所述待测细菌基因组中的位置记为所述候选前噬菌体的候选位置;
(5)连接所述候选序列首尾,得到环状序列;根据如下方法确定所述候选前噬菌体是否为功能性前噬菌体:所述测序数据中含有跨越所述候选序列首尾连接处的测序读长,所述候选前噬菌体为或候选为功能性噬菌体;所述测序数据中不含跨越所述候选序列首尾连接处的测序读长,所述候选前噬菌体不为或候选不为功能性噬菌体。


2.一种细菌基因组中前噬菌体位置的检测方法,包括:
(1)对待测细菌基因组进行高通量测序,得到测序数据;所述待测细菌含有噬菌体;
(2)预测所述测序数据中的开放阅读框,得到所述开放阅读框编码的蛋白质,将其记为候选蛋白质;
(3)将所述候选蛋白质的序列与噬菌体蛋白质库中序列进行比对,能与噬菌体蛋白质比对上的候选蛋白质为功能性蛋白质,不能与噬菌体蛋白质比对上的候选蛋白质为非功能性蛋白质;所述功能蛋白质的编码基因在所述待测细菌基因组中的位置为候选前噬菌体所处的位置,将该位置记为粗略位置;
(4)在所述粗略位置及其上下游采用滑动窗口方法查找正向重复序列,所述正向重复序列是指溶原性噬菌体整合进细菌基因组后所形成的前噬菌体序列两端的正向重复序列;所述采用滑动窗口方法包括:在所述粗略位置及其上下游定义两个长度均为n的滑动窗口,n为50bp,两个滑动窗口间的距离为10,000bp,比对两个滑动窗口的序列,确定两个滑动窗口中是否存在互为正向重复序列,如两个滑动窗口中不存在互为正向重复序列,则将两个滑动窗口延序列的上下游滑动以确定所述粗略位置及其上下游是否存在正向重复序列;
将含有所述功能蛋白质的编码基因的两条互为正向重复序列间的序列记为所述候选前噬菌体的候选序列,将所述候选序列在所述待测细菌基因组中的位置记为所述候选前噬菌体的候选位置;
(5)连接所述候选序列首尾,得到环状...

【专利技术属性】
技术研发人员:张湘莉兰谢湘成童贻刚孙强彭绍亮翟诗翔童善惟牛琦
申请(专利权)人:中国人民解放军军事科学院军事医学研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1