一种基于cgMLST的变异链球菌分型方法技术

技术编号:26652085 阅读:24 留言:0更新日期:2020-12-09 00:54
本发明专利技术属于细菌分型技术领域,具体涉及一种基于cgMLST的变异链球菌分型方法,包括原始cgMLST靶基因集的构建、获取候选基因组、获取有效cgMLST靶基因、获取基因样品全基因组信息、评估变异链球菌cgMLST的分辨率。本发明专利技术相比现有技术具有以下优点:本发明专利技术中实现对变异链球菌cgMLST的分辨率的评估,验证cgMLST能对变异链球菌有效分型,解决了MLST分型对亲缘关系近的变异链球菌分离株的分型效果较差的问题,应用于变异链球菌的传播分析,能够更有效、更可靠的鉴别变异链球菌菌株,对龋病的防治有重要意义。

【技术实现步骤摘要】
一种基于cgMLST的变异链球菌分型方法
本专利技术属于细菌分型
,具体涉及一种基于cgMLST的变异链球菌分型方法。
技术介绍
龋病是以细菌为主的多因素作用下,牙齿硬组织发生慢性进行性破坏的细菌感染性疾病。龋病在未经及时治疗的状况下,会继发牙髓炎、根尖周炎、影响继承恒牙的发育、甚至导致颌骨骨髓炎、间隙感染等严重后果。2016年Lancet公布的全球328种疾病中恒牙龋的患病率排名第一。我国一直高度重视口腔健康工作,在《“健康中国2030”规划纲要》中提出2030年将12岁儿童患龋率控制在25%以内。然而,2015年第四次全国口腔流行病学调查数据显示,12岁儿童恒牙患龋率高达38.5%,比十年前上升了9.6个百分点。此次调查结果亦表明,5岁儿童和65-74岁老年人的龋病流行状况也非常值得担忧,患龋率分别高达71.9%和98.0%。由此可见,龋病的防治工作是我国口腔公共卫生事业中十分重要并迫切的任务。变异链球菌是目前公认的重要的特异性致龋菌,变异链球菌能够很容易地粘附在牙齿表面,形成生物膜,并在碳水化合物代谢后释放酸性化合物,从而腐蚀牙面,导致牙齿脱矿、龋病发生的第一步。多数流行病学数据表明,与无龋儿童相比,变形链球菌更常见于龋患儿童的口腔中,并且从龋患儿童口腔中分离的变异链球菌,其致龋毒力显著高于无龋儿童组。因此,更好地了解变异链球菌的遗传多样性,对阐明变异链球菌致病性和在其在人类之间的传播能力有着重要的流行病学价值。明确变异链球菌的分子分型是了解其遗传多样性的关键因素,最初根据变异链球菌表面的鼠李糖葡萄糖聚合物的组分将变异链球菌分成c、e、f和k这四种血清型。然而,这种方法难以继续将同一血清型的菌株进一步分型。随着分子技术的发展,后续陆续出现多种基因分型方法,包括核糖分型、任意引物聚合酶链反应(AP-PCR)、染色体DNA限制性片段多态性、重复外源性回文聚合酶链反应(rep-PCR)、多位点酶电泳和脉冲场凝胶电泳(PFEG)。然而,这些分型方法比较耗时,并且难以继续区分菌株亚型。2007年,Nakano等首次报道了应用多位点序列分型(MLST)的方法来更有效、更可靠地鉴别变异链球菌菌株。MLST是根据8个管家基因的序列信息,首先命名等位基因,继而根据等位基因的分配结果构建相应的序列型(ST)。该方法简单有效,并且重复性高。Do等在2010年也构建并报告了另一个变异链球菌MLST方法。DoMLST和NakanoMLST的区别主要是管家基因存在区别,该两种方法均证实有效并广泛用于变异链球菌的传播分析中。为了解蚌埠地区口腔牙菌斑来源的变异链球菌的流行病学状况,我们在MLST的国际数据库提交了80株变异链球菌临床分离株的全基因组信息,并获得了相应的Nakano和DoMLST的ST。这80株变异链球菌临床分离株分别来自31个有龋儿童(ECC)和9个无龋儿童(CF)。每位儿童提供2株细菌,其中有龋儿童的2株细菌分别来自有龋牙面(ECC-C)和无龋牙面(ECC-F)。这40对儿童共80株细菌的Nakano和DoMLST分型结果均表明,仅有3对儿童口腔分离的2株细菌分别拥有不同的ST,其他37对儿童口腔分离的2株细菌的ST均相同。进一步的进化树分析结果亦表明来自同一个体口腔的2株细菌的亲缘关系较近,可能来自同一祖先。这提示,MLST分型对于亲缘关系近的变异链球菌分离株的分型效果较差。变异链球菌的分子分型方法亟待进一步完善。查阅文献,我们发现,核心基因组多位点序列分型方法(cgMLST)被证实在细菌的分型方法的分辨度要显著优于MLST。这种cgMLST方法已成功地用于许多病原体的分型,包括滑膜支原体、布鲁氏菌属、耶尔森菌属、单核细胞增生李斯特菌、头状葡萄球菌、银葡萄球菌和金黄色葡萄球菌等。虽然cgMLST策略已经被很好地报道,但是关于变异链球菌cgMLST的文章尚未见报道。因此,我们根据NCBI上报道的199株变异链球菌的全基因组数据构建了针对变异链球菌分子分型的cgMLST,并继而结合我们实验室80株蚌埠地区分离株的MLST结果和全基因组数据验证cgMLST该方法在变异链球菌分型中的有效性。
技术实现思路
本专利技术的目的是针对现有MLST分型对亲缘关系近的变异链球菌分离株的分型效果较差的问题,提供了一种基于cgMLST的变异链球菌分型方法。本专利技术是通过以下技术方案实现的:一种基于cgMLST的变异链球菌分型方法,包括以下步骤:(1)原始cgMLST靶基因集的构建选择变异链球菌UA159基因组作为参考基因组,对变异链球菌UA159基因组中基因进行过滤筛选,获得初步的原始cgMLST靶基因集;过滤条件包括:过滤长度小于50bp的基因;过滤缺少起始或终止密码子的基因;过滤具有多个终止密码子的基因;过滤任何重叠大于4b的基因,只保留长度最长的基因;过滤与转座子数据库存在高度同源的基因,需要满足identity>50%,cover>70%;过滤与质粒基因数据库上高度同源的基因,需要满足ident>90%,overlap>95%;(2)获取候选基因组(2.1)候选基因组的筛选从NCBI上下载全部199个变异链球菌全基因组数据,根据NakanoMLST对变异链球菌全基因组数据进行过滤筛选,得到候选基因组;过滤条件包括:过滤contig数目≥200且Scaffold长度<500bp的基因组;过滤不包含所有MLST核心基因的基因组,单基因拷贝数<75%的基因组;(2.2)对候选基因组的代表性进行评估基于变异链球菌MLST分型数据库中分型标准,对候选基因组进行分型,得到分型结果,将所得分型结果与变异链球菌MLST分型数据库分型结果进行整合得到最小生成树,根据最小生成树结果观察候选基因组在现有的ST分型结果中的分布情况,覆盖率高证明候选基因组的筛选方法有效;(3)获取有效cgMLST靶基因(3.1)有效cgMLST靶基因的筛选在候选基因组的基础上对原始cgMLST靶基因集中的基因进行过滤,得到有效cgMLST靶基因;过滤条件包括:保留原始cgMLST靶基因集中所有在候选基因组中存在并且为单拷贝基因的基因,过滤原始cgMLST靶基因集中在候选基因组中出现终止密码子缺失或者提现终止频率超过20%的基因;(3.2)对有效cgMLST靶基因的代表性进行评估对有效cgMLST靶基因及NakanoMLST的管家基因在参考基因组上的分布情况进行评估,有效cgMLST靶基因在参考基因组上均匀分布,且有效cgMLST靶基因包括了NakanoMLST的管家基因,则证明有效cgMLST靶基因的筛选方法有效;(4)获取基因样品全基因组信息利用提取试剂盒提取基因样品的DNA得到DNA片段,然后按照文库制备试剂盒的说明步骤,对DNA片段经末端修复、加A尾、加测序接头、纯化、PCR扩增步骤完成文库制备,得到所有基因样品全基因组;再经测序、组装后得到每个基因样品全基因组信息;(5本文档来自技高网
...

【技术保护点】
1. 一种基于cgMLST的变异链球菌分型方法,其特征在于,包括以下步骤:/n(1)原始cgMLST靶基因集的构建/n选择变异链球菌UA159基因组作为参考基因组,对变异链球菌UA159基因组中基因进行过滤筛选,获得初步的原始cgMLST靶基因集;/n过滤条件包括:过滤长度小于50bp的基因;过滤缺少起始或终止密码子的基因;过滤具有多个终止密码子的基因;过滤任何重叠大于4b的基因,只保留长度最长的基因;过滤与转座子数据库存在高度同源的基因,需要满足identity>50%,cover>70%;过滤与质粒基因数据库上高度同源的基因,需要满足ident>90%,overlap>95%;/n(2)获取候选基因组/n(2.1)候选基因组的筛选/n从NCBI上下载全部199个变异链球菌全基因组数据,根据Nakano MLST对变异链球菌全基因组数据进行过滤筛选,得到候选基因组;/n过滤条件包括:过滤contig数目≥200且Scaffold长度<500bp的基因组;过滤不包含所有MLST核心基因的基因组,单基因拷贝数<75%的基因组;/n(2.2)对候选基因组的代表性进行评估/n基于变异链球菌MLST分型数据库中分型标准,对候选基因组进行分型,得到分型结果,将所得分型结果与变异链球菌MLST分型数据库分型结果进行整合得到最小生成树,根据最小生成树结果观察候选基因组在现有的ST分型结果中的分布情况,覆盖率高证明候选基因组的筛选方法有效;/n(3)获取有效cgMLST靶基因/n(3.1)有效cgMLST靶基因的筛选/n在候选基因组的基础上对原始cgMLST靶基因集中的基因进行过滤,得到有效cgMLST靶基因;/n过滤条件包括:保留原始cgMLST靶基因集中所有在候选基因组中存在并且为单拷贝基因的基因,过滤原始cgMLST靶基因集中在候选基因组中出现终止密码子缺失或者提现终止频率超过20%的基因;/n(3.2)对有效cgMLST靶基因的代表性进行评估/n对有效cgMLST靶基因及Nakano MLST的管家基因在参考基因组上的分布情况进行评估,有效cgMLST靶基因在参考基因组上均匀分布,且有效cgMLST靶基因包括了Nakano MLST的管家基因,则证明有效cgMLST靶基因的筛选方法有效;/n(4)获取基因样品全基因组信息/n利用提取试剂盒提取基因样品的DNA得到DNA片段,然后按照文库制备试剂盒的说明步骤,对DNA片段经末端修复、加A尾、加测序接头、纯化、PCR扩增步骤完成文库制备,得到所有基因样品全基因组;再经测序、组装后得到每个基因样品全基因组信息;/n(5)评估变异链球菌cgMLST的分辨率/n将步骤(4)中全基因组信息向MLST的国际数据库提交,根据Nakano MLST的管家基因的序列信息,得到对应的序列型ST;根据有效cgMLST靶基因的序列信息,得到对应的序列型cgST;使用SPSS 20.0软件对序列型ST和序列型cgST进行pearson卡方检验,P值<0.05时具有统计学意义;/n分别通过HKY和GTR模型,基于序列型ST和序列型cgST,构建最大似然发育树,利用软件分别绘制模型进化树,根据两种模型进化树的拓扑结构评估cgMLST的重复性,重复性高则分辨率高。/n...

【技术特征摘要】
1.一种基于cgMLST的变异链球菌分型方法,其特征在于,包括以下步骤:
(1)原始cgMLST靶基因集的构建
选择变异链球菌UA159基因组作为参考基因组,对变异链球菌UA159基因组中基因进行过滤筛选,获得初步的原始cgMLST靶基因集;
过滤条件包括:过滤长度小于50bp的基因;过滤缺少起始或终止密码子的基因;过滤具有多个终止密码子的基因;过滤任何重叠大于4b的基因,只保留长度最长的基因;过滤与转座子数据库存在高度同源的基因,需要满足identity>50%,cover>70%;过滤与质粒基因数据库上高度同源的基因,需要满足ident>90%,overlap>95%;
(2)获取候选基因组
(2.1)候选基因组的筛选
从NCBI上下载全部199个变异链球菌全基因组数据,根据NakanoMLST对变异链球菌全基因组数据进行过滤筛选,得到候选基因组;
过滤条件包括:过滤contig数目≥200且Scaffold长度<500bp的基因组;过滤不包含所有MLST核心基因的基因组,单基因拷贝数<75%的基因组;
(2.2)对候选基因组的代表性进行评估
基于变异链球菌MLST分型数据库中分型标准,对候选基因组进行分型,得到分型结果,将所得分型结果与变异链球菌MLST分型数据库分型结果进行整合得到最小生成树,根据最小生成树结果观察候选基因组在现有的ST分型结果中的分布情况,覆盖率高证明候选基因组的筛选方法有效;
(3)获取有效cgMLST靶基因
(3.1)有效cgMLST靶基因的筛选
在候选基因组的基础上对原始cgMLST靶基因集中的基因进行过滤,得到有效cgMLST靶基因;
过滤条件包括:保留原始cgMLST靶基因集中所有在候选基因组中存在并且为单拷贝基因的基因,过滤原始cgMLST靶基因集中在候选基因组中出现终止密码子缺失或者提现终止频率超过20%的基因;
(3.2)对有效cgMLST靶基因的代表性进行评估
对有效cgMLST靶基因及NakanoMLST的管家基因在参考基因组上的分布情况进行评估,有效cgMLST靶基因在参考基因组上均匀分布,且有效cgMLST靶基因包括了NakanoMLST的管家基因,则证明有效cgMLST靶基因的筛选方法有效;
(4)获取基因样品全基因组信息
利用提取试剂盒提取基因样品的DNA得到DNA片段,然后按照文库制备试剂盒的...

【专利技术属性】
技术研发人员:刘姗姗张凯陈永锋
申请(专利权)人:蚌埠医学院第一附属医院蚌埠医学院附属肿瘤医院
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1