基于宏基因组学的病原分析方法、分析装置、设备及存储介质制造方法及图纸

技术编号:26381359 阅读:20 留言:0更新日期:2020-11-19 23:50
本发明专利技术涉及一种基于宏基因组学的病原分析方法、分析装置、设备及存储介质。本发明专利技术所提出的基于宏基因组学的自动化病原分析方法,一方面整合优化了数据分析方法流程和工具,对病原鉴定过程进行标准化,能够大幅提速数据分析时间,缩减临床检测周期,实现快速检测。另一方面平台通过建立微生物参考序列数据库和病原信息库,综合评估参数和证据等级来有效区分病原菌与背景菌,可有效防止因未覆盖而导致的漏检,进一步提升临床检测结果的参考意义和可解读性。

【技术实现步骤摘要】
基于宏基因组学的病原分析方法、分析装置、设备及存储介质
本专利技术涉及生物信息学
,特别是涉及一种基于宏基因组学的病原分析方法、分析装置、设备及存储介质。
技术介绍
宏基因组测序(metagenomicnext-generationsequencing,mNGS)是综合分析来自患者样本的微生物和宿主的基因物质(DNA和RNA)的方法,应用于多种感染性疾病的诊断、疾病和健康状态下病原微生物分析。其检测通量高,靶标涵盖几乎所有潜在病原,非常适合发现新发病原体和不明感染源。mNGS以无需纯化培养、全面快速检测样本中的所有潜在病原体在相关领域得到认可,同时mNGS具有更高的病原体鉴定灵敏度,受抗生素的影响较小。因此,mNGS对检测传染性病原体具有重要的潜力及实用意义。虽然mNGS已经在相关应用中取得不错的成绩,但是要提供“一站式”成熟的解决方案,传统的mNGS在实验重复性、结果可靠性及解读准确性方面仍然存在不足,对mNGS的标准化造成障碍。
技术实现思路
基于此,有必要提供一种重复性、可靠性和准确性较好的基于宏基因组学的病原分析方法。一种基于宏基因组学的病原分析方法,包括以下步骤:步骤S1:根据待测样品的测序数据获取序列信息;步骤S2:对所述序列信息进行质控分析,去除质量不合格的序列和宿主序列,得到目标序列数据;步骤S3:基于微生物参考序列数据库,从所述目标序列数据中分析得到微生物物种分类数据;步骤S4:基于病原信息库,从所述微生物物种分类数据中分析得到与疾病相关的病原数据;步骤S5:根据所述病原数据输出所述待测样品的病原检测结果。在其中一个实施例中,所述步骤S2包括以下步骤:步骤S21:从所述测序数据中识别并去除碱基错误率大于1%的序列,得到合格序列数据;步骤S22:从所述合格序列数据中识别并去除宿主序列,得到所述目标序列数据。在其中一个实施例中,所述步骤S3包括以下步骤:步骤S31:将所述目标序列数据与所述微生物参考序列数据库进行比对,得到第一比对结果;步骤S32:按照一致性大于90%、覆盖度大于90%且比对分值小于最优分值的110%的标准对所述第一比对结果进行过滤,得到第二比对结果;步骤S33:根据所述第二比对结果的基因信息标识编号获取对应的物种编号,并根据物种编号获取物种注释信息,然后对所述第二比对结果中的每条序列进行物种鉴定;步骤S34:分别统计每一个分类层级上鉴定到的每一种微生物的序列数目,作为该微生物的初始丰度值;步骤S35:矫正每一种微生物的所述初始丰度值。在其中一个实施例中,在步骤S33中采用LCA算法进行物种鉴定,和/或在步骤S35中采用RPM算法矫正所述初始丰度值。在其中一个实施例中,所述步骤S4包括以下步骤:步骤S41:将每一种微生物的物种名称与所述病原信息库进行比对,确认该微生物是否属于病原;步骤S42:将确认为病原的微生物按照以下标准进行过滤:对于鉴定为RNA病毒的微生物,其序列数目需≥3;对于鉴定为DNA病毒、细菌、古菌、真菌或寄生虫的微生物,其RPMratio需≥10。在其中一个实施例中,还包括以下步骤:步骤S5:对所述微生物物种分类数据或所述病原数据进行深度分析,所述深度分析包括微生物多样性分析、多样品比较分析、关联分析、显著差异物种分析和耐药基因鉴定中的一种或多种。在其中一个实施例中,还包括以下步骤:步骤S6:根据所述病原数据生成可视化数据,所述可视化数据包括病原丰度饼图、测序覆盖度展示图和序列一致性展示图中的一种或多种。在其中一个实施例中,还包括以下步骤:步骤S7:定期查询公共数据库中新增或修改的数据,并对应更新本地的所述微生物参考序列数据库和所述病原信息库。在其中一个实施例中,所述步骤S7包括以下步骤:步骤S71:定期查询公共序列数据库中新增或修改的序列数据并下载到本地;步骤S72:从已下载的序列数据中分离出微生物参考序列,并写入所述微生物参考序列数据库中;步骤S73:定期查询公共病原信息库中新增或修改的数据,并写入所述病原信息库中。在其中一个实施例中,所述步骤S72包括以下步骤:步骤S721:从NCBI中获取GI编号与物种编号对应表、物种编号与物种名称对应表和物种编号与上一层级物种编号对应表;步骤S722:根据已下载序列数据的GI编号获取对应的物种编号,并根据物种编号获取对应的物种分类信息;步骤S723:根据所述物种分类信息保留已下载序列数据中属于细菌、古菌、真菌、病毒、寄生虫的序列数据。本专利技术还提供了一种基于宏基因组学的病原分析装置,包括:数据识别模块,用于根据待测样品的测序数据获取序列信息;数据质控模块,用于对所述序列信息进行质控分析,去除质量不合格的序列和宿主序列,得到目标序列数据;微生物鉴定模块,用于基于微生物参考序列数据库,从所述目标序列数据中分析得到微生物物种分类数据;病原鉴定模块,用于基于病原信息库,从所述微生物物种分类数据中分析得到与疾病相关的病原数据;及报告模块,用于根据所述病原数据输出所述待测样品的病原检测结果。本专利技术还提供了一种计算机设备,具有处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述的病原分析方法的步骤。本专利技术还提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如上所述的病原分析方法的步骤。本专利技术所提出的基于宏基因组学的自动化病原分析方法,一方面整合优化了数据分析方法流程和工具,对病原鉴定过程进行标准化,能够大幅提速数据分析时间,缩减临床检测周期,实现快速检测。另一方面平台通过建立微生物参考序列数据库和病原信息库,综合评估参数和证据等级来有效区分病原菌与背景菌,可有效防止因未覆盖而导致的漏检,进一步提升临床检测结果的参考意义和可解读性。本专利技术将推动mNGS检测病原体的标准化,为突发性不明病原体感染性疾病提供快速有效的检测。同时可以和医院已有测序仪进行整合,打破传统的医院需将mNGS检测数据分析外包给技术服务公司进行分析的模式,院内即可实现数据分析,缩短报告时间,提升检测效率,同时还避免了医院原始信息和数据的外流,也可基于数据挖掘产出更多有临床价值的科研成果。附图说明图1为一实施例的病原分析方法的流程示意图;图2为一实施例的病原分析装置的结构示意图;图3为实施例1数据集的部分测序序列和微生物参考序列数据库的比对结果;图4为实施例1数据集的部分物种鉴定结果;图5为实施例1数据集的部分病原鉴定结果;图6为实施例1的微生物多样性分析结果;图7为实施例1的显著差异物种分析的LDA值分布柱状图;图8为实施例1的显著差异物种分析的进化分支图;图9为实施例1的多样品比较分析的物种组成柱状图;...

【技术保护点】
1.一种非疾病诊断和治疗目的的基于宏基因组学的病原分析方法,其特征在于,包括以下步骤:/n步骤S1:根据待测样品的测序数据获取序列信息;/n步骤S2:对所述序列信息进行质控分析,去除质量不合格的序列和宿主序列,得到目标序列数据;/n步骤S3:基于微生物参考序列数据库,从所述目标序列数据中分析得到微生物物种分类数据;/n步骤S4:基于病原信息库,从所述微生物物种分类数据中分析得到与疾病相关的病原数据;/n步骤S5:根据所述病原数据输出所述待测样品的病原检测结果。/n

【技术特征摘要】
1.一种非疾病诊断和治疗目的的基于宏基因组学的病原分析方法,其特征在于,包括以下步骤:
步骤S1:根据待测样品的测序数据获取序列信息;
步骤S2:对所述序列信息进行质控分析,去除质量不合格的序列和宿主序列,得到目标序列数据;
步骤S3:基于微生物参考序列数据库,从所述目标序列数据中分析得到微生物物种分类数据;
步骤S4:基于病原信息库,从所述微生物物种分类数据中分析得到与疾病相关的病原数据;
步骤S5:根据所述病原数据输出所述待测样品的病原检测结果。


2.根据权利要求1所述的病原分析方法,其特征在于,所述步骤S2包括以下步骤:
步骤S21:从所述测序数据中识别并去除碱基错误率大于1%的序列,得到合格序列数据;
步骤S22:从所述合格序列数据中识别并去除宿主序列,得到所述目标序列数据。


3.根据权利要求1所述的病原分析方法,其特征在于,所述步骤S3包括以下步骤:
步骤S31:将所述目标序列数据与所述微生物参考序列数据库进行比对,得到第一比对结果;
步骤S32:按照一致性大于90%、覆盖度大于90%且比对分值小于最优分值的110%的标准对所述第一比对结果进行过滤,得到第二比对结果;
步骤S33:根据所述第二比对结果的基因信息标识编号获取对应的物种编号,并根据物种编号获取物种注释信息,然后对所述第二比对结果中的每条序列进行物种鉴定;
步骤S34:分别统计每一个分类层级上鉴定到的每一种微生物的序列数目,作为该微生物的初始丰度值;
步骤S35:矫正每一种微生物的所述初始丰度值。


4.根据权利要求1所述的病原分析方法,其特征在于,所述步骤S4包括以下步骤:
步骤S41:将每一种微生物的物种名称与所述病原信息库进行比对,确认该微生物是否属于病原;
步骤S42:将确认为病原的微生物按照以下标准进行过滤:对于鉴定为RNA病毒的微生物,其序列数目需≥3;对于鉴定为DNA病毒、细菌、古菌、真菌或寄生虫的微生物,其RPMratio需≥10。


5.根据权利...

【专利技术属性】
技术研发人员:张鑫磊王勇强陈俊如
申请(专利权)人:苏州协云基因科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1