一种宏基因组分析装置制造方法及图纸

技术编号:25772143 阅读:28 留言:0更新日期:2020-09-25 21:21
本实用新型专利技术涉及一种宏基因组分析装置,其包括:测序组件,用于获取两组以上核酸样本的核酸序列;数据库比对组件,其设置在测序组件的下游,用于将所述核酸序列与参照数据库进行比对进而得到比对后的核酸序列;综合分析组件,其设置在数据库比对组件的下游,用于分析比对后的核酸序列和收集组间差异信息;以及分析结果输出组件,其设置在综合分析组件的下游,用于输出所述差异信息。

【技术实现步骤摘要】
一种宏基因组分析装置
本技术涉及一种宏基因组分析装置,其普遍适用于多种研究对象,能够用于多种研究对象的差异基因和差异物种分析,并可以实现通路富集。
技术介绍
宏基因组:宏基因组(Metagenome)(也称微生物环境基因组MicrobialEnvironmentalGenome,或元基因组)是由Handelsman等1998年提出的新名词,其定义为“thegenomesofthetotalmicrobiotafoundinnature”,即环境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因,目前主要指环境样本中的细菌和真菌的基因组总和。宏基因组学(或元基因组学,metagenomics)是一种以环境样本中的微生物群体基因组为研究对象,以功能基因筛选和/或测序分析为研究手段,以微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系为研究目的的新的微生物研究方法。一般包括从环境样本中提取基因组DNA,进行高通量测序分析,或克隆DNA到合适的载体,导入宿主菌体,筛选目的转化子等工作。16S:16SrRNA(16S)为核糖体的RNA的一个亚基,16SrDNA就是编码该亚基的基因。细菌rRNA(核糖体RNA)按沉降系数分为3种,分别为5S、16S和23SrRNA。16SrDNA是细菌染色体上编码rRNA相对应的DNA序列,存在于所有细菌染色体基因中。16SrDNA是细菌的系统分类研究中最有用的和最常用的分子钟,其种类少,含量大(约占细菌RNA含量的80%),分子大小适中,存在于所有的生物中,其进化具有良好的时钟性质,在结构与功能上具有高度的保守性,素有“细菌化石”之称。在大多数原核生物中rDNA都具有多个拷贝,5S、16S、23SrDNA的拷贝数相同。16SrDNA由于大小适中,约1.5Kb左右,其既能体现不同菌属之间的差异,又能利用测序技术较容易地得到其序列,故被细菌学家和分类学家接受。如上所述,宏基因组是一种非常重要的分子生物研究领域,其以环境样本中的微生物群体基因组为研究对象,环境样本主要包括水体、土壤和生物体等。然而由于环境样本间的性质存在较大差异。目前尚没有可以普遍适用于多种研究对象的宏基因组分析装置,导致宏基因组分析的效能不高。此外,对人类肠道宏基因组的研究因其环境样本的特殊复杂性,也存在分析效能不高的问题。
技术实现思路
肠道宏基因组与人类健康息息相关,是重要的研究对象之一。本技术以生物体中人类肠道宏基因组为研究基础,开发了一种能够普遍适用于多种研究对象的宏基因组分析装置。相比对其它研究对象,人类肠道宏基因组的特点如下:(1)存在少量宿主DNA污染;(2)多数菌体已知;(3)以大肠杆菌为主;(4)多为case-control型设计,以寻找生物标记物种或者基因为目的。基于上述特点,本技术在宏基因组的分析过程中:首先,结合全基因组鸟枪法的测序片段及其对参考物种基因组序列的覆盖情况,判断物种信息更具参考价值。其次,采用本地数据库存储参考物种基因组序列,与此同时,当研究对象混有本地数据库没有记载的物种时,通过调用本地数据库以外的其他收录有本地数据库没有记载的物种的数据库进行处理,并且将本地数据库没有记载的物种的数据收录进本地数据库,在提高分析效率的同时,也使本地数据库不断完善和丰富。此外,不仅在物种与基因层面寻找生物标记,还通过通路富集,把某一个代谢通路作为研究对像,更方便把握样本间的整体变化情况。第四,并非所有检测得到的生物标记都有效,生物标记无效的原因在于,部分差异物种或差异基因是在研究对象中惯常存在的,即无效的生物标记虽然在具有不同表征的研究对象间存在差异,但这些差异(如差异物种或差异基因)并不是引起研究对象具有不同表征的原因,因此需要排除无效的生物标记来提高检测结果的准确度和检测效率。具体来说,本技术涉及一种宏基因组分析装置,其包括:测序组件,用于获取两组以上核酸样本的核酸序列;数据库比对组件,其设置在测序组件的下游,用于将所述核酸序列与参照数据库进行比对进而得到比对后的核酸序列;综合分析组件,其设置在数据库比对组件的下游,用于分析比对后的核酸序列和收集所述两组以上核酸样本的组间差异信息;以及分析结果输出组件,其设置在综合分析组件的下游,用于输出所述组间差异信息,其中,所述数据库比对组件包括:数据库存储单元、第一比对单元和第二比对单元,所述数据库存储单元,其设置在测序组件的下游,用于存储参照数据库,所述参照数据库为第一数据库和第二数据库,所述第一比对单元,其设置在测序组件的下游,与数据库存储单元相连接,用于将所述核酸序列通过数据库存储单元与第一数据库进行比对,并收集与第一数据库不相匹配的核酸序列;所述第二比对单元,其设置在第一比对单元的下游,与数据库存储单元相连接,用于将所述与第一数据库不匹配的核酸序列通过数据库存储单元与第二数据库进行比对,并收集与第二数据库相匹配的核酸序列,得到比对后的核酸序列;所述综合分析组件包括组间差异统计单元、差异物种收集单元和差异基因收集单元,所述组间差异统计单元,其设置在数据库比对组件的下游,用于获取获取组间差异信息。所述组间差异信息包括任一物种的组间差异信息。所述差异物种收集单元和差异基因收集单元,其并列设置在组间差异统计单元的下游,用于收集所述组间差异信息中的差异物种和差异基因。在本技术的一个具体的宏基因组分析装置中,所述数据库比对组件还包括数据库调用单元和补充比对单元,所述数据库调用单元,其与所述数据库存储单元并列设置,用于调取所述数据库存储单元没有存储的第三数据库,所述补充比对单元,其设置在第二比对单元的下游,与数据库存储单元和数据库调用单元相连接,用于将所述与第二数据库不相匹配的核酸序列通过数据库调用单元与第三数据库进行比对,并收集与第三数据库相匹配的核酸序列,得到比对后的核酸序列,以及与第三数据库相匹配的核酸序列所对应的物种和基因数据。在本技术的另一个具体的宏基因组分析装置中,所述补充比对单元还用于将所述与第三数据库相匹配的核酸序列所对应的物种和基因数据补充到第二数据库中。在本技术的另一个具体的宏基因组分析装置中,所述差异物种收集单元包括指定物种排除元件,所述指定物种排除元件,其用于消除指定物种的核酸序列。所述指定物种为组内差异统计值和组间差异统计值没有显著统计学差异的物种。在本技术的另一个具体的宏基因组分析装置中,所述第一数据库为宿主基因组数据库。所述第二数据库为微生物基因组数据库。或者,所述第一数据库为宿主基因组数据库和所述第二数据库为微生物基因组数据库。在本技术的另一个具体的宏基因组分析装置中,该宏基因组分析装置还包括:过滤组件,其设置在测序组件的下游,以及数据库比对组件的上游,用于对测序组件获取的核酸序列进行过滤处理,以去除不符合测序质量要求的核酸序列。在本技术的另一个具体的宏基因组分析装置中,该宏基因组分析装置还包括:修正组件,其设置在数本文档来自技高网
...

【技术保护点】
1.宏基因组分析装置,其特征在于,包括:/n测序组件,用于获取两组以上核酸样本的核酸序列;/n数据库比对组件,其设置在测序组件的下游,用于将所述核酸序列与参照数据库进行比对进而得到比对后的核酸序列;/n综合分析组件,其设置在数据库比对组件的下游,用于分析比对后的核酸序列和收集所述两组以上核酸样本的组间差异信息;以及/n分析结果输出组件,其设置在综合分析组件的下游,用于输出所述组间差异信息,/n其中,/n所述数据库比对组件包括:数据库存储单元、第一比对单元和第二比对单元,/n所述数据库存储单元,其设置在测序组件的下游,用于存储参照数据库,所述参照数据库为第一数据库和第二数据库,/n所述第一比对单元,其设置在测序组件的下游,与数据库存储单元相连接,用于将所述核酸序列通过数据库存储单元与第一数据库进行比对,并收集与第一数据库不相匹配的核酸序列;/n所述第二比对单元,其设置在第一比对单元的下游,与数据库存储单元相连接,用于将所述与第一数据库不相匹配的核酸序列通过数据库存储单元与第二数据库进行比对,并收集与第二数据库相匹配的核酸序列,得到比对后的核酸序列;/n所述综合分析组件包括组间差异统计单元、差异物种收集单元和差异基因收集单元,/n所述组间差异统计单元,其设置在数据库比对组件的下游,用于获取组间差异信息,/n所述差异物种收集单元和差异基因收集单元,其并列设置在组间差异统计单元的下游,分别用于收集所述组间差异信息中的差异物种和差异基因。/n...

【技术特征摘要】
1.宏基因组分析装置,其特征在于,包括:
测序组件,用于获取两组以上核酸样本的核酸序列;
数据库比对组件,其设置在测序组件的下游,用于将所述核酸序列与参照数据库进行比对进而得到比对后的核酸序列;
综合分析组件,其设置在数据库比对组件的下游,用于分析比对后的核酸序列和收集所述两组以上核酸样本的组间差异信息;以及
分析结果输出组件,其设置在综合分析组件的下游,用于输出所述组间差异信息,
其中,
所述数据库比对组件包括:数据库存储单元、第一比对单元和第二比对单元,
所述数据库存储单元,其设置在测序组件的下游,用于存储参照数据库,所述参照数据库为第一数据库和第二数据库,
所述第一比对单元,其设置在测序组件的下游,与数据库存储单元相连接,用于将所述核酸序列通过数据库存储单元与第一数据库进行比对,并收集与第一数据库不相匹配的核酸序列;
所述第二比对单元,其设置在第一比对单元的下游,与数据库存储单元相连接,用于将所述与第一数据库不相匹配的核酸序列通过数据库存储单元与第二数据库进行比对,并收集与第二数据库相匹配的核酸序列,得到比对后的核酸序列;
所述综合分析组件包括组间差异统计单元、差异物种收集单元和差异基因收集单元,
所述组间差异统计单元,其设置在数据库比对组件的下游,用于获取组间差异信息,
所述差异物种收集单元和差异基因收集单元,其并列设置在组间差异统计单元的下游,分别用于收集所述组间差异信息中的差异物种和差异基因。


2.根据权利要求1所述的宏基因组分析装置,其特征在于,所述数据库比对组件还包括数据库调用单元和补充比对单元,
所述数据库调用单元,其与所述数据库存储单元并列设置,用于调取所述数据库存储单元没有存储的第三数据库,
所述补充比对单元,其设置在第二比对单元的下游,与数据库存储单元和数据库调用单元相连接,用于将与第二数据库不相匹配的核酸序列通过数据库调用单元与第三数据库进行比对,并收集与第三数据库相匹配的核酸序列,得到比对后的核酸序列,以及与第三数据库相匹配的核酸序列所对应的物种和基...

【专利技术属性】
技术研发人员:刘三阳陈鹏燕刘涛李志民李大为玄兆伶王海良王娟
申请(专利权)人:安诺优达义乌医学检验有限公司安诺优达生命科学研究院浙江安诺优达生物科技有限公司北京安诺优达医学检验实验室有限公司安诺优达基因科技北京有限公司
类型:新型
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1