【技术实现步骤摘要】
一种大肠杆菌菌株鉴定方法和系统
[0001]本专利技术属于细菌生物体的检测与识别和测序领域,涉及一种大肠杆菌菌株鉴定方法和系统。
技术介绍
[0002]大肠杆菌是一种革兰氏阴性的直杆菌。大肠杆菌是一种兼性厌氧微生物,能够进行呼吸代谢和发酵代谢。大肠杆菌分为多种菌株,一些菌株可以作为肠道微生物与人类形成有益的共生关系,而还有一些菌株进入人体后会产生毒素,引起肠道、泌尿系统、肺部和神经系统等部位的疾病。除此之外大肠杆菌也是重要的工程微生物,被广泛应用于化工、食品、生物医药、动物饲料和化妆品等多个领域。不同大肠杆菌工程菌株有截然不同的作用,例如DH5α菌株存在DNA酶缺陷,有利于保存质粒、克隆基因,但是该菌株容易降解蛋白质,不适合作为表达菌株。而BL21(DE3)菌株能够高效表达T7启动子驱动的外源基因,且存在蛋白酶基因缺失不容易降解蛋白质,适合用于非毒性蛋白质的表达。生产和科研中使用错误的大肠杆菌菌株会较大地影响效率,甚至会使结果偏离预期。对生产和科研中使用的大肠杆菌菌株进行菌株鉴定可以在质量控制环节中起到重要的作用。
[0003]目前大肠杆菌菌株鉴定的方法有:
[0004]培养分离法(见专利CN111235075A),将样本在特定选择培养基上培养、挑选,然后对培养物进行特定基因的PCR扩增,根据凝胶电泳成像判断是否某种菌株阳性。
[0005]蛋白模式识别法(见专利CN109884160A),对菌株进行培养,并对培养物进行质谱分析,根据结果中代谢物的模式识别特定类别的大肠杆菌菌株。
[00 ...
【技术保护点】
【技术特征摘要】
1.一种大肠杆菌菌株鉴定方法,其特征在于,根据待测大肠杆菌菌株二代测序的核酸序列数据,进行数据质控、数据比对和数据组装后,在构建的全基因组多位点序列分型数据库中比对查找到基因序列分型最接近的菌株,得到鉴定结果;所述全基因组多位点序列分型数据库通过以下步骤构建获得:S1、大肠杆菌菌株核酸序列获取:从NCBI获取大肠杆菌菌株核酸序列,得到fasta文件;S2、大肠杆菌工程菌知识库建立:收集现有的大肠杆菌工程菌信息,建立所述大肠杆菌工程菌知识库;S3、大肠杆菌菌株分类:使用mash程序分析所述步骤S1获得的fasta文件,计算所有目标菌株核酸序列两两之间的序列差异性;使用CL层次聚类算法将所有目标菌株根据核酸序列差异性划分为N个大肠杆菌菌株分类;N取大于0的整数;S4、参考基因组选取:对于每1个所述步骤S3获得的大肠杆菌菌株分类,计算分类中所有菌株与同类菌株的平均序列差异性;对分类中所有大肠杆菌菌株按与同类菌株的平均序列差异性从小到大排列,选取与分类内部所有菌株核酸序列平均序列差异性最小的菌株核酸序列作为该分类的参考基因组,从而得到大肠杆菌菌株参考基因组;所述大肠杆菌菌株参考基因组的数量为N个,对应N个大肠杆菌菌株分类;S5、全基因组多位点序列分型靶基因选取:对于各个所述大肠杆菌菌株分类对应的所述大肠杆菌菌株参考基因组,从NCBI获取所有基因编码区序列;在同一个所述大肠杆菌菌株分类中,对于有相同序列的基因编码区,仅保留其中一个;将过滤后的基因作为该所述大肠杆菌菌株分类的全基因组多位点序列分型靶基因;S6、菌株库去冗余:对于各个所述大肠杆菌菌株分类中的所有菌株,保留所述大肠杆菌工程菌知识库包含的菌株,对于所述大肠杆菌工程菌知识库之外的菌株进行去冗余处理:如果多个菌株之间序列差异性小于M,则仅保留与其他同类菌株平均序列差异性最小的菌株;M为0.00005
‑
0.0005;S7、构建得到所述全基因组多位点序列分型数据库:对于每1个所述大肠杆菌菌株分类,利用blat或blast将该分类中去冗余后的菌株一一比对到该分类的所述大肠杆菌菌株参考基因组的基因编码区上,得到各个菌株的全基因组多位点序列分型靶基因序列分型,构建完成所述全基因组多位点序列分型数据库。2.如权利要求1所述的大肠杆菌菌株鉴定方法,其特征在于,包括以下步骤:A1、数据质控;A2、数据比对:通过数据比对得到样本在各个所述大肠杆菌菌株分类中的大肠杆菌菌株参考基因组的比对率、对大肠杆菌菌株参考基因组的基因组覆盖率和对大肠杆菌菌株参考基因组的基因组覆盖深度;A3、数据组装;A4、全基因组多位点序列分型靶基因检索:调用blat或blast程序将所述步骤A3拼接后的样本contigs比对到各个所述大肠杆菌菌株分类的大肠杆菌菌株参考基因组的基因编码区上,计算所述拼接后的样本contigs包含的各个分类的全基因组多位点序列分型靶基因数量、靶基因序列分型;A5、样本大肠杆菌一级分类;在同一个样本中,依次按全基因组多位点序列分型靶基因数量、大肠杆菌菌株参考基因组的对比率和对大肠杆菌菌株参考基因组的基因组覆盖率对
所述步骤A4比对的所述大肠杆菌菌株分类降序排列,取排名第一的大肠杆菌菌株分类为该样本所属的目标分类;A6、样本大肠杆菌二级分类:在所述步骤A5找到的目标分类中,使用pyMLST程序的wgMLST流程线计算样本基因...
【专利技术属性】
技术研发人员:陈靓靓,李源,王佳伟,潘轶,程朝泽,
申请(专利权)人:上海序祯达生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。