一种基于宏基因组学的病原微生物检测方法及装置制造方法及图纸

技术编号:31157185 阅读:46 留言:0更新日期:2021-12-04 09:53
本发明专利技术公开了一种基于宏基因组学的病原微生物检测方法及装置,包括:获取待检测样本的宏基因组测序数据;对宏基因组测序数据进行预处理,得到目标数据;对目标数据进行筛选,得到目标序列;对目标序列进行聚类分析,获得待测样本的候选物种类别;将目标数据与非冗余参考基因集进行比对,并计算每个基因在单个样本中的丰度,得到待测样本的目标物种分类信息;将目标数据与病原微生物可检测数据库中的信息进行比对,获得待测样本的耐药基因和毒性元件信息;将目标物种分类信息、耐药基因和毒性元件信息,确定为待检测样本的检测结果。本发明专利技术提升了病原微生物检测适用性范围和病原检测准确性。测准确性。测准确性。

【技术实现步骤摘要】
一种基于宏基因组学的病原微生物检测方法及装置


[0001]本专利技术涉及生物
,特别是涉及一种基于宏基因组学的病原微生物检测方法及装置。

技术介绍

[0002]微生物广泛存在于自然界,多数为单细胞生物。微生物通常包括病毒、细菌、真菌、原生动物和某些藻类等。在医疗的应用角度,快速检测出临床样本中的病原微生物对感染性疾病的诊断、治疗和预后有重要的临床意义。
[0003]微生物组学研究在过去的几十年里发展迅速,尤其是宏基因组测序技术(Metagenomic Next

Generation Sequencing)在病原微生物检测中的应用发挥了巨大的作用。下一代测序可以实现疾病的诊断、审问及传染病的追踪。当前纳米孔测序的有很多的缺点:测序错误较多、通量较低、每个碱基的平均测序代价较高,因此限制了纳米孔测序的应用。相对于纳米孔测序,mNGS测序对于病原体检测的具有非常明显的优势。
[0004]然而,目前利用宏基因组测序检测病原微生物中的方法中存在检测时间长、准确性低、光度窄,未知的感染病原体不能被检测出来的问题。

技术实现思路

[0005]针对于上述问题,本专利技术提供一种基于宏基因组学的病原微生物检测方法及装置,提升了病原微生物检测适用性范围和病原检测准确性。
[0006]为了实现上述目的,本专利技术提供了如下技术方案:一种基于宏基因组学的病原微生物检测方法,包括:获取待检测样本的宏基因组测序数据;对所述宏基因组测序数据进行预处理,得到目标数据,所述目标数据为满足目标质量条件的宏基因组测序数据;对所述目标数据进行筛选,得到目标序列;对所述目标序列进行聚类分析,获得所述待测样本的候选物种类别;将所述目标数据与非冗余参考基因集进行比对,并计算每个基因在单个样本中的丰度,得到所述待测样本的目标物种分类信息;将所述目标数据与病原微生物可检测数据库中的信息进行比对,获得所述待测样本的耐药基因和毒性元件信息;将所述目标物种分类信息、所述耐药基因和所述毒性元件信息,确定为所述待检测样本的检测结果。
[0007]可选地,所述对所述宏基因组测序数据进行预处理,得到目标数据,包括:对所述宏基因组测序数据进行过滤,得到高质量的序列;去除所述高质量的序列中宿主测序序列,并将冗余序列去除,去除后的序列;将所述去除后的序列与参考序列进行比对处理,得到目标数据。
[0008]可选地,还包括:若所述去除后的序列的长度小于预设长度阈值,将去除后的序列进行拼接,得到拼接后的序列。
[0009]可选地,所述对所述目标数据进行筛选,得到目标序列,包括确定开放阅读框的长度,并利用所述长度的开放阅读框识别所述目标数据,得到初始序列;将所述初始序列中的序列中间存在终止密码子,且若两个有重叠的初始序列翻译的起始坐标的差值不是三的倍数的初始序列进行过滤,得到过滤后的序列;根据翻译的氨基酸,将过滤后的序列中含有终止密码子的序列去除,得到目标序列。
[0010]可选地,所述对所述目标序列进行聚类分析,获得所述待测样本的候选物种类别,包括:获取每一所述目标序列的读码的绝对位置信息;基于所述绝对位置信息对所述目标序列进行拼接,并将拼接后的目标序列组合成基因向量矩阵;根据所述基因向量矩阵生成基因特征自学习求解器,并获得学习率的最优解;根据所述学习率最优解进行基因预测,得到所述待测样本的候选物种类别。
[0011]一种基于宏基因组学的病原微生物检测装置,包括:获取单元,用于获取待检测样本的宏基因组测序数据;预处理单元,用于对所述宏基因组测序数据进行预处理,得到目标数据,所述目标数据为满足目标质量条件的宏基因组测序数据;筛选单元,用于对所述目标数据进行筛选,得到目标序列;分析单元,用于对所述目标序列进行聚类分析,获得所述待测样本的候选物种类别;计算单元,用于将所述目标数据与非冗余参考基因集进行比对,并计算每个基因在单个样本中的丰度,得到所述待测样本的目标物种分类信息;比对单元,用于将所述目标数据与病原微生物可检测数据库中的信息进行比对,获得所述待测样本的耐药基因和毒性元件信息;确定单元,用于将所述目标物种分类信息、所述耐药基因和所述毒性元件信息,确定为所述待检测样本的检测结果。
[0012]可选地,所述预处理单元包括:第一过滤子单元,用于对所述宏基因组测序数据进行过滤,得到高质量的序列;第一去除子单元,用于去除所述高质量的序列中宿主测序序列,并将冗余序列去除,去除后的序列;比对子单元,用于将所述去除后的序列与参考序列进行比对处理,得到目标数据。
[0013]可选地,还包括:拼接子单元,用于若所述去除后的序列的长度小于预设长度阈值,将去除后的序列进行拼接,得到拼接后的序列。
[0014]可选地,所述筛选单元包括
识别子单元,用于确定开放阅读框的长度,并利用所述长度的开放阅读框识别所述目标数据,得到初始序列;第二过滤子单元,用于将所述初始序列中的序列中间存在终止密码子,且若两个有重叠的初始序列翻译的起始坐标的差值不是三的倍数的初始序列进行过滤,得到过滤后的序列;第二去除子单元,用于根据翻译的氨基酸,将过滤后的序列中含有终止密码子的序列去除,得到目标序列。
[0015]可选地,所述分析单元包括:获取子单元,用于获取每一所述目标序列的读码的绝对位置信息;序列拼接子单元,用于基于所述绝对位置信息对所述目标序列进行拼接,并将拼接后的目标序列组合成基因向量矩阵;生成子单元,用于根据所述基因向量矩阵生成基因特征自学习求解器,并获得学习率的最优解;预测子单元,用于根据所述学习率最优解进行基因预测,得到所述待测样本的候选物种类别。
[0016]相较于现有技术,本专利技术提供了一种基于宏基因组学的病原微生物检测方法及装置,包括:获取待检测样本的宏基因组测序数据;对宏基因组测序数据进行预处理,得到目标数据,目标数据为满足目标质量条件的宏基因组测序数据;对目标数据进行筛选,得到目标序列;对目标序列进行聚类分析,获得待测样本的候选物种类别;将目标数据与非冗余参考基因集进行比对,并计算每个基因在单个样本中的丰度,得到待测样本的目标物种分类信息;将目标数据与病原微生物可检测数据库中的信息进行比对,获得待测样本的耐药基因和毒性元件信息;将目标物种分类信息、耐药基因和毒性元件信息,确定为待检测样本的检测结果。本专利技术提升了病原微生物检测适用性范围和病原检测准确性。
附图说明
[0017]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0018]图1为本专利技术实施例提供的一种基于宏基因组学的病原微生物检测方法的流程示意图;图2为本专利技术实施例提供的一种病原微生物自学习检测系统的流程图;图3为本专利技术实施例提供的一种基于宏基因组学的病原微生物检测装置的结构示意图。
具体实施方式
[001本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于宏基因组学的病原微生物检测方法,其特征在于,包括:获取待检测样本的宏基因组测序数据;对所述宏基因组测序数据进行预处理,得到目标数据,所述目标数据为满足目标质量条件的宏基因组测序数据;对所述目标数据进行筛选,得到目标序列;对所述目标序列进行聚类分析,获得所述待测样本的候选物种类别;将所述目标数据与非冗余参考基因集进行比对,并计算每个基因在单个样本中的丰度,得到所述待测样本的目标物种分类信息;将所述目标数据与病原微生物可检测数据库中的信息进行比对,获得所述待测样本的耐药基因和毒性元件信息;将所述目标物种分类信息、所述耐药基因和所述毒性元件信息,确定为所述待检测样本的检测结果。2.根据权利要求1所述的方法,其特征在于,所述对所述宏基因组测序数据进行预处理,得到目标数据,包括:对所述宏基因组测序数据进行过滤,得到高质量的序列;去除所述高质量的序列中宿主测序序列,并将冗余序列去除,去除后的序列;将所述去除后的序列与参考序列进行比对处理,得到目标数据。3.根据权利要求2所述的方法,其特征在于,还包括:若所述去除后的序列的长度小于预设长度阈值,将去除后的序列进行拼接,得到拼接后的序列。4.根据权利要求1所述的方法,其特征在于,所述对所述目标数据进行筛选,得到目标序列,包括确定开放阅读框的长度,并利用所述长度的开放阅读框识别所述目标数据,得到初始序列;将所述初始序列中的序列中间存在终止密码子,且若两个有重叠的初始序列翻译的起始坐标的差值不是三的倍数的初始序列进行过滤,得到过滤后的序列;根据翻译的氨基酸,将过滤后的序列中含有终止密码子的序列去除,得到目标序列。5.根据权利要求1所述的方法,其特征在于,所述对所述目标序列进行聚类分析,获得所述待测样本的候选物种类别,包括:获取每一所述目标序列的读码的绝对位置信息;基于所述绝对位置信息对所述目标序列进行拼接,并将拼接后的目标序列组合成基因向量矩阵;根据所述基因向量矩阵生成基因特征自学习求解器,并获得学习率的最优解;根据所述学习率最优解进行基因预测,得到所述待测样本的候选物种类别。6.一种基于宏基因组学的病原微生物检测装置,其特征在于,包括:获取单元,用于获取待检测样本的宏基因组测...

【专利技术属性】
技术研发人员:盖伟李瑞琳关尚京
申请(专利权)人:杭州萧山微岩医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1