System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种病原微生物信息的识别方法、装置、终端及存储介质制造方法及图纸_技高网

一种病原微生物信息的识别方法、装置、终端及存储介质制造方法及图纸

技术编号:40671766 阅读:5 留言:0更新日期:2024-03-18 19:08
本发明专利技术涉及物种识别与数据处理技术领域,提供一种病原微生物信息的识别方法、装置、终端及存储介质,该方法包括:获取检测报告;对检测报告进行特征提取,获得初始特征数据;对初始特征数据进行处理,生成标准化特征向量;将标准化特征向量作为输入,利用训练好的识别模型进行识别,获得物种信息识别结果;识别模型包括至少一个泛化识别模型和至少一个高危识别模型,高危识别模型基于第一训练集训练得到,泛化识别模型基于第二训练集得到,第一训练集中的训练数据为第二训练集中经泛化识别模型识别后输出结果为指定类别的训练数据,本发明专利技术能够提高病原微生物信息的识别效率。

【技术实现步骤摘要】

本专利技术涉及物种识别与数据处理,尤其涉及一种病原微生物信息的识别方法、装置、终端及存储介质


技术介绍

1、目前,宏基因组(mngs)测序技术通过分析感染病人样本中的病原dna、rna将宏基因组技术从实验层面推向了应用层面,利用病原宏基因组方法识别病原微生物作为一项应用领域的前沿技术,受到了较多医疗机构的认可。相较于传统微生物培养、pcr等方法在病原体发现过程中存在的局限性,基于mngs的方法具备多方面的优势,在实现全面准确的感染病原检测的同时,还提高了检测速度。

2、然而,由于在宏基因组检测过程中,往往伴随着几十种乃至上百种微生物并存的情况,故单个样本可能鉴定出多达数十到数百乃至上千种微生物,而这些微生物之中,往往只有几种是临床医生真正需要关注的物种,其他物种可能是环境背景物种,也可能是关键致病菌的近源物种,乃至于一些可能存在的污染物种。如何从纷繁复杂的候选微生物列表中,识别出个别高危决定性的责任病原微生物对医学报告人员而言是一项繁琐且具有挑战性的工作。相关技术中,对关注物种的准确判断和识别需要依靠临床医生或者报告审核人员。然而当样本量提高,或者送检样本包含的微生物种类繁多,审核人员对于报告解读的工作量和工作难度都将大幅度提升。


技术实现思路

1、本专利技术提供了一种病原微生物信息的识别方法、装置、终端及存储介质,以降低现有技术中进行病原微生物信息识别的工作量和工作难度,提高病原微生物信息的识别效率。

2、第一方面,本专利技术提供了一种病原微生物信息的识别方法,包括:

3、获取检测报告,所述检测报告为对检测样本进行病原微生物宏基因组检测得到的报告;

4、对所述检测报告进行特征提取,获得初始特征数据;

5、对所述初始特征数据进行处理,生成标准化特征向量;

6、将所述标准化特征向量作为输入,利用训练好的识别模型进行识别,获得物种信息识别结果;其中,所述识别模型包括至少一个泛化识别模型和至少一个高危识别模型,所述高危识别模型基于第一训练集训练得到,所述泛化识别模型基于第二训练集得到,所述第一训练集为所述第二训练集的子集,所述第一训练集中的训练数据为所述第二训练集中经所述泛化识别模型识别后输出结果为指定类别的训练数据,所述泛化识别模型和所述高危识别模型均为深度神经网络模型;

7、其中,所述泛化识别模型的输出结果包括:不关注、疑似背景微生物、关注和重点关注;所述指定类别包括:关注和重点关注。

8、第二方面,本专利技术提供了一种病原微生物信息的识别装置,包括:

9、信息获取单元,用于获取检测报告,所述检测报告为对检测样本进行病原微生物宏基因组检测得到的报告;

10、特征提取单元,用于对所述检测报告进行特征提取,获得初始特征数据;

11、数据处理单元,用于对所述初始特征数据进行处理,生成标准化特征向量;

12、模型识别单元,用于将所述标准化特征向量作为输入,利用训练好的识别模型进行识别,获得物种信息识别结果;其中,所述识别模型包括至少一个泛化识别模型和至少一个高危识别模型,所述高危识别模型基于第一训练集训练得到,所述泛化识别模型基于第二训练集得到,所述第一训练集为所述第二训练集的子集,所述第一训练集中的训练数据为所述第二训练集中经所述泛化识别模型识别后输出结果为指定类别的训练数据,所述泛化识别模型和所述高危识别模型均为深度神经网络模型;

13、其中,所述泛化识别模型的输出结果包括:不关注、疑似背景微生物、关注和重点关注;所述指定类别包括:关注和重点关注。

14、第三方面,本专利技术提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。

15、第四方面,本专利技术提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。

16、本专利技术提供一种病原微生物信息的识别方法、装置、终端及存储介质,通过对检测样本的病原微生物宏基因组检测报告进行特征提取和数据处理,得到能体现病原微生物特征的标准化特征向量,再利用训练好的识别模型对标准化特征向量进行识别,从而获得病原微生物信息的识别结果,解决了现有技术中主要依赖临床医生或者报告审核人员进行识别带来的工作量大工作难度高的问题,提高了识别效率。并且,识别模型包括泛化识别模型和高危识别模型,通过泛化识别模型可汇总尽可能多的微生物特征,有利于对一些新的或少见的物种的识别检出,提高了识别的全面性;通过高危识别模型可聚焦于已知的易感物种,快速识别出检测样本中需关注及需重点关注的病原微生物信息,进一步提升了识别效率。

本文档来自技高网...

【技术保护点】

1.一种病原微生物信息的识别方法,其特征在于,包括:

2.如权利要求1所述的病原微生物信息的识别方法,其特征在于,所述初始特征数据包括:

3.如权利要求2所述的病原微生物信息的识别方法,其特征在于,所述对所述初始特征数据进行处理,生成标准化特征向量包括:

4.如权利要求1至3任一项所述的病原微生物信息的识别方法,其特征在于,所述识别模型的训练步骤包括:

5.如权利要求4所述的病原微生物信息的识别方法,其特征在于,所述选取精确度评分符合预设条件的模型作为训练好的识别模型包括:

6.如权利要求4所述的病原微生物信息的识别方法,其特征在于,若所述检测报告的审核流程逻辑发生变化,所述方法还包括:

7.如权利要求1至3中任一项所述的病原微生物信息的识别方法,其特征在于,所述将所述标准化特征向量作为输入,利用训练好的识别模型进行识别,获得物种信息识别结果包括:

8.一种病原微生物信息的识别装置,其特征在于,包括:

9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上的权利要求1至7中任一项所述病原微生物信息的识别方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上的权利要求1至7中任一项所述病原微生物信息的识别方法的步骤。

...

【技术特征摘要】

1.一种病原微生物信息的识别方法,其特征在于,包括:

2.如权利要求1所述的病原微生物信息的识别方法,其特征在于,所述初始特征数据包括:

3.如权利要求2所述的病原微生物信息的识别方法,其特征在于,所述对所述初始特征数据进行处理,生成标准化特征向量包括:

4.如权利要求1至3任一项所述的病原微生物信息的识别方法,其特征在于,所述识别模型的训练步骤包括:

5.如权利要求4所述的病原微生物信息的识别方法,其特征在于,所述选取精确度评分符合预设条件的模型作为训练好的识别模型包括:

6.如权利要求4所述的病原微生物信息的识别方法,其特征在于,若所述检测报告的审核流程逻辑发生变化,所述方法还包括...

【专利技术属性】
技术研发人员:王迪张栋徐英春杨启文赵颖王瑶陆旻雅周梦兰丁文超薛继统
申请(专利权)人:中国医学科学院北京协和医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1