基于宏基因组学的毒素基因丰度检测方法及注释数据库构建方法技术

技术编号:33811009 阅读:35 留言:0更新日期:2022-06-16 10:20
本发明专利技术公开了一种基于宏基因组学的毒素基因丰度检测方法及注释数据库构建方法,属于生物信息技术领域,包括以下步骤:S1、样本采集并且建库测序,获得待测样本的宏基因组测序数据;S2、对所述宏基因组测序数据进行筛选,得到测序序列;S3、对所述测序序列与毒素基因参考数据库进行比对,获取每个基因的比对reads数量;S4、根据基因长度将reads数量标准化为相对丰度,然后基于内参基因序列的拷贝数计算每个毒素基因的绝对丰度;其中所述新的毒素因子参考序列数据库是通过添加已知量的内参基因序列到毒素因子参考序列数据库中形成的。采用该检测方法,可以检测出疾病相关的毒素因子基因,能够更准确的反映样本中基因的真实拷贝数和样本组间的真实差异。和样本组间的真实差异。和样本组间的真实差异。

【技术实现步骤摘要】
基于宏基因组学的毒素基因丰度检测方法及注释数据库构建方法


[0001]本专利技术属于生物信息
,具体涉及一种基于宏基因组学的毒素基因丰度检测方法,还涉及一种毒素基因的注释数据库构建方法。

技术介绍

[0002]毒素因子(Virulence factor,VFs)指由细菌、病毒和真菌代谢产生的带有侵袭力和毒素等毒力性质的分子。微生物感染宿主,主要是因为相关的致病菌携带了可引起宿主细胞损伤的毒素因子编码基因,可抑制或逃避宿主的免疫反应,进而能够出入宿主细胞,并进一步和宿主掠夺营养,达到自身增殖生长的目的。
[0003]前沿科学研究中,常见的毒素因子数据库包括TADB(https://bioinfo

mml.sjtu.edu.cn/TADB/)、Tox

Prot(http://www.expasy.org/sprot/tox

prot)、T3DB(http://www.t3db.ca/)和VFDB(http://www.mgc.ac.cn/VFs/)等。其中,VFDB数据库的总体引用量达到了800多篇(2020年8月),是引用量最高,收集范围最全面,更新最及时的数据库。VFDB是由中国医学科学院研发,收集整理了多种重要医学病原菌的已知毒素因子的组成、结构、功能、致病机理、毒力岛、序列和基因组信息等内容。
[0004]目前毒素因子的主要检测方法有两类:(1)根据DNA序列设计引物,基于PCR扩增的原理设计成试剂盒,从而对目标DNA片段进行扩增,基于荧光强度确认有无;(2)对DNA片段进行测序,将测序后的序列做物种和毒素基因的注释分析,从而确定毒素因子的存在。但是方法一通常只能针对几个常见的基因做鉴定和分型,而方法二虽然理论上可以注释出大量的毒素基因,但是只能做到相对丰度的计算,确定毒素因子的存在而无法衡量其强弱。在高通量测序技术的辅助下,宏基因组研究飞速发展,定量宏基因组学也越来越得到重视,定量宏基因组是通过在样本中添加固定量的已知序列作为统一内参,计算样本中每种基因的拷贝数后,基于内参做一致性的标准化,从而实现绝对定量。相比于普通的宏基因组测序技术,定量宏基因组技术能够更准确的反映样本中基因的真实拷贝数和样本组间的真实差异,更准确的反映样本中微生物群落的真实变化,不仅仅具有前沿的科学价值,也具有实际的应用意义。在这里,我们基于定量宏基因组高通量测序技术,检测并且定量了测序样本中毒素基因的丰度,在更广阔的范围和更精确的分辨率上实现了毒素因子的检测。

技术实现思路

[0005]为了克服现有技术中的上述不足,本专利技术的目的之一在于提供一种基于宏基因组学的毒素基因丰度检测方法,可以检测出疾病相关的毒素因子基因,能够更准确的反映样本中基因的真实拷贝数和样本组间的真实差异,更准确的反映样本中微生物群落的真实变化。
[0006]本专利技术的目的之二在于提供一种毒素因子基因的注释数据库构建方法,将检测到的毒素基因进行注释,阐释了毒素因子关联的物种和作用的机制。
[0007]本专利技术的目的之三在于提供一种计算机可读存储介质。
[0008]为了实现上述目的之一,本专利技术采用以下技术方案:
[0009]本专利技术提供一种引物探针组合物,包括以下步骤:
[0010]S1、样本采集并且建库测序,获得待测样本的宏基因组测序数据;
[0011]S2、对所述宏基因组测序数据进行筛选,得到高质量的测序序列;
[0012]S3、对所述高质量的测序序列与毒素基因参考数据库进行比对,获取每个基因的比对reads数量;
[0013]S4、根据基因长度将read数量标准化为相对丰度,然后基于内参基因序列的拷贝数计算每个毒素基因的绝对丰度;
[0014]其中所述新的毒素因子参考序列数据库是通过添加已知量的内参基因序列到毒素因子参考序列数据库中形成的。
[0015]进一步地,所述步骤S1中包括步骤:
[0016]所述样本是采集的待检测用户的粪便组织,提取所述的粪便组织中的菌群DNA并且进行质控;
[0017]向质控合格的所述菌群DNA中添加已知量的内参DNA,基于小片段文库构建方法建立DNA文库并且质控;
[0018]将质控合格的所述DNA文库,进行双端测序,获得所述待测样本的宏基因组测序数据。
[0019]进一步地,所述步骤S2中包括步骤:
[0020]在获得所述待测样本的宏基因组测序数据后,去除接头序列以及低质量碱基序列;
[0021]通过与宿主基因组比对,去除来源于所述宿主基因组的reads,得到所述高质量的测序序列。
[0022]为了实现上述目的之二,本专利技术采用以下技术方案:
[0023]本专利技术提供一种毒素基因的注释数据库构建方法,包括对毒素因子参考序列数据库进行注释,构建成毒素基因的注释数据库。
[0024]进一步地,基于所述毒素因子参考序列数据库,将每个所述毒素基因生成其类型、相关物种及作用机制的注释。
[0025]为了实现上述目的之三,本专利技术采用以下技术方案:
[0026]本专利技术提供一种计算机可读存储介质,所述计算机可读介质能被处理器执行以实现一种基于宏基因组学的毒素基因丰度检测方法及其注释数据库构建方法。
[0027]与现有技术相比,本专利技术具有的有益效果如下:
[0028](1)本专利技术提供的一种基于宏基因组学的毒素基因丰度检测方法,可以检测出疾病相关的毒素因子基因,能够更准确的反映样本中基因的真实拷贝数和样本组间的真实差异,更准确的反映样本中微生物群落的真实变化,以在在更广阔的范围和更精确的分辨率上实现了毒素因子的检测。
[0029](2)本专利技术提供的一种毒素因子基因的注释数据库构建方法,基于预建立的新的毒素因子参考序列数据库,将检测到的毒素因子做了注释,阐释了毒素因子关联的物种和作用的机制,可以辅助临床医生判断患者是否具有特定毒素感染,并且这些毒素因子还有
潜力用作治疗靶点,提高病人的治疗效果。
[0030](3)本专利技术的粪便样品是方便运输的,并且粪便采样方法是无创的和舒适的,所以人们将更容易参与到指定过程中。
附图说明
[0031]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1是本申请实施例1提供的肠道毒素基因丰度检测方法及其注释数据库构建方法的流程示意图。
[0033]图2是本申请实施例2提供的肠道毒素因子的KEGG注释结果示意图。
[0034]图3是本申请实施例1提供的肠道毒素基因丰度检测方法在模拟数据集中的检测准确性评估。
具体实施方式
[0035]为了使本申请要解决的技术问题、技术方案及有益效果更加清楚明白,以下将结合实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于宏基因组学的毒素基因丰度检测方法,其特征在于,包括以下步骤:S1、样本采集并且建库测序,获得待测样本的宏基因组测序数据;S2、对所述宏基因组测序数据进行筛选,得到测序序列;S3、对所述测序序列与新的毒素基因参考数据库进行比对,获取每个基因的比对reads数量;S4、根据基因长度将reads数量标准化为相对丰度,然后基于内参基因序列的拷贝数计算每个毒素基因的绝对丰度;其中所述新的毒素因子参考序列数据库是通过添加已知量的内参基因序列到毒素因子参考序列数据库中形成的。2.根据权利要求1所述的一种基于宏基因组学的毒素基因丰度检测方法,其特征在于,所述S1中包括步骤:所述样本是采集的待检测用户的粪便组织,提取所述的粪便组织中的菌群DNA并且进行质控;向质控合格的所述菌群DNA中添加已知量的内参DNA,基于小片段文库构建方法建立DNA文库并且质控;将质控合格的所述DNA文库,进行双端测序,获得所述待测样本的宏基因组测序数据。3.根据权利要求1所述的一种基于宏基因组学的毒素基因丰度检测方法,其特征在于,所述S2中包括步骤:在获得所述待测样本的宏基因组测序数据后,去除接头,去除碱基质量值小于13或碱基平均质量值小于20的序列,去除含N碱基比例>5%的碱基序列;通过与宿主基因组比对,去除来源于所述宿主基因组的reads,得到所述测序序列。4.根据权利要求1所述的一种基于宏基因组学的毒素基因丰度检测方法,其特征在于,所述S3中包括步骤:使用Bowtie2将所述测序序列与所述新的毒素基因数据库进行比对,统计比对到每条基因上的唯一比对和多比对双端reads数量;基于所述唯一比对上的read...

【专利技术属性】
技术研发人员:罗文韩丽娟
申请(专利权)人:康美华大基因技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1