诊断结果识别、模型训练的方法、计算机设备及存储介质技术

技术编号:23364308 阅读:40 留言:0更新日期:2020-02-18 17:51
本发明专利技术公开了诊断结果识别、模型训练的方法、计算机设备及存储介质,该方法包括:获取参考数据集及样本数据集;参考数据集包括症状参考集合和诊断参考集合,训练样本集中的每个训练样本包括目标症状和目标诊断;将目标症状与症状参考集合中的参考症状进行匹配,将目标诊断与诊断参考集合中的参考诊断进行匹配,得到匹配结果;按照位置标识将匹配结果转换成用于表示病况的样本序列串集合;利用生成式对抗网络GAN的生成器,生成伪序列串集合;将训练样本集和训练样本集中每个训练样本对应的诊断结果输入到判别器,得到诊断结果识别模型。诊断结果识别模型用于对临床决策支持系统CDSS输出的诊断结果进行识别,以降低CDSS输出的诊断结果的误诊率。

Diagnosis result recognition, model training method, computer equipment and storage medium

【技术实现步骤摘要】
诊断结果识别、模型训练的方法、计算机设备及存储介质
本专利技术涉及机器学习
,尤其涉及一种诊断结果识别、模型训练的方法、计算机设备及存储介质。
技术介绍
目前,人工智能技术已经在生活中有了较广泛的应用,其中也涉及到医疗领域。人工智能在医学领域一个非常重要的应用是临床决策支持系统(ClinicalDecisionSupportSystem,CDSS),CDSS包括临床辅助诊断系统,临床辅助诊断系统旨在根据患者的症状等信息给出疑似诊断。目前CDSS系统采用的诊断模型一般为概率模型,传统机器学习模型,深度网络模型等。这些模型在一些输入场景下能表现出很好的效果,但是不可否认的是无论哪种模型,都会在一些场景下表现失常(尤其是概率模型),会给出不合逻辑的甚至是错误的结果,即误诊。误诊会给CDSS用户和患者带来极大的不便甚至危害,应该尽量避免。目前的CDSS系统最常见的误诊控制方法是通过制定一些规则来过滤诊断结果,如根据性别过滤不合理的诊断,规则的数量有限,比较局限,因此对质控效果贡献不大。
技术实现思路
本专利技术实施例提供一种诊断结果识别、模型训练的方法、计算机设备及存储介质,用于降低CDSS输出的诊断结果的误诊率。第一方面,本专利技术实施例提供了一种诊断结果识别模型训练的方法,包括:获取参考数据集及样本数据集;所述参考数据集包括症状参考集合和诊断参考集合,所述训练样本集中的每个训练样本包括目标症状和目标诊断;所述症状参考集合中的每个参考症状及所述诊断参考集合中的每个参考诊断均具有位置标识;将所述目标症状与所述症状参考集合中的参考症状进行匹配,将所述目标诊断与所述诊断参考集合中的参考诊断进行匹配,得到匹配结果;按照所述位置标识将所述匹配结果转换成用于表示病况的样本序列串集合;利用生成式对抗网络GAN的生成器,生成伪序列串集合;将训练样本集和所述训练样本集中每个训练样本对应的诊断结果输入到所述GAN的判别器,所述训练样本集包括获取的样本序列串集合和所述伪序列串集合,利用所述训练样本集及所述对应的诊断结果对所述判别器进行训练,得到诊断结果识别模型,所述诊断结果识别模型用于对临床决策支持系统CDSS输出的诊断结果进行识别,以得到识别结果第二方面,本专利技术实施例提供了一种诊断结果识别的方法,包括:获取输入到临床决策支持系统CDSS的目标症状及所述CDSS根据所述目标症状输出的诊断结果;将所述目标症状与所述症状参考集合中的参考症状进行匹配,将所述目标诊断与所述诊断参考集合中的参考诊断进行匹配,得到匹配结果,症状参考集合中的参考症状和诊断参考集合中的参考诊断均具有位置标识;按照位置标识将所述匹配结果转换成用于表示病况的序列串;将所述序列串及对应的诊断结果输入到上述第一方面所述的诊断结果识别模型,通过所述诊断结果识别模型输出所述诊断结果对应的识别结果。第三方面,本专利技术实施例提供了一种诊断结果识别模型训练的装置,包括:获取模块,用于获取参考数据集及样本数据集;所述参考数据集包括症状参考集合和诊断参考集合,所述训练样本集中的每个训练样本包括目标症状和目标诊断;所述症状参考集合中的每个参考症状及所述诊断参考集合中的每个参考诊断均具有位置标识;匹配模块,用于将所述获取模块获取的所述目标症状与所述症状参考集合中的参考症状进行匹配,将所述获取模块获取的所述目标诊断与所述诊断参考集合中的参考诊断进行匹配,得到匹配结果;转换模块,用于按照所述位置标识将所述匹配模块得到的所述匹配结果转换成用于表示病况的样本序列串集合;序列串生成模块,用于利用生成式对抗网络GAN的生成器,生成伪序列串集合,所述伪序列串集合中的伪序列串的数据大小与所述样本序列串集合中的样本序列串的数据大小相同;模型生成模块,用于将训练样本集和所述训练样本集中每个训练样本对应的诊断结果输入到所述GAN的判别器,所述训练样本集包括所述获取模块获取的样本序列串集合和所述序列串生成模块生成的伪序列串集合,利用所述训练样本集及所述对应的诊断结果对所述判别器进行训练,得到诊断结果识别模型,所述诊断结果识别模型用于对临床决策支持系统CDSS输出的诊断结果进行识别,以得到识别结果第四方面,本专利技术实施例提供了一种诊断结果识别的装置,包括:获取模块,用于获取输入到临床决策支持系统CDSS的目标症状及所述CDSS根据所述目标症状输出的诊断结果;匹配模块,用于将所述获取模块获取的所述目标症状与所述症状参考集合中的参考症状进行匹配,将所述目标诊断与所述诊断参考集合中的参考诊断进行匹配,得到匹配结果,症状参考集合中的参考症状和诊断参考集合中的参考诊断均具有位置标识;转换模块,用于按照位置标识将所述匹配模块匹配的所述匹配结果转换成用于表示病况的序列串;识别结果生成模块,用于将转换模块转换的所述序列串及对应的诊断结果输入到上述第一方面所述的诊断结果识别模型,通过所述诊断结果识别模型输出所述诊断结果对应的识别结果。第五方面,本专利技术实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面,或者,第二方面所述的方法。第六方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面,或者,第二方面所述的方法。本专利技术实施例中,获取参考数据集及样本数据集;所述参考数据集包括症状参考集合和诊断参考集合,所述训练样本集中的每个训练样本包括目标症状和目标诊断;将所述目标症状与所述症状参考集合中第一预置数量的参考症状进行匹配,将所述目标诊断与所述诊断参考集合中第二预置数量的参考诊断进行匹配,得到匹配结果。按照参数数据集中的位置标识将匹配结果转换成用于表示病况的样本序列串集合,该样本序列串集合作为训练判别器的真实数据样本,利用生成器生成的伪序列串集合,通过对样本序列串集合和伪序列串集合的训练,得到诊断结果识别模型,所述诊断结果识别模型用于对临床决策支持系统CDSS输出的诊断结果进行识别,以得到识别结果,该识别结果可以CDSS的诊断结果的正确性,以降低CDSS输出的诊断结果的误诊率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本专利技术实施例中诊断结果识别模型训练的方法的一个实施例的步骤流程示意图;图2是本专利技术实施例中诊断结果识别的方法的一个实施例的步骤流程示意图;图3是本专利技术实施例中诊断结果识别模型训练的装置的一个实施例的结构示意图;图4是本专利技术实施例中诊断结果识别的装置的一个实施例的结构示意图;图5是本专利技术实施例中计算机设备的一个实施例的结构示意图。本文档来自技高网...

【技术保护点】
1.一种诊断结果识别模型训练的方法,其特征在于,包括:/n获取参考数据集及样本数据集;所述参考数据集包括症状参考集合和诊断参考集合,所述训练样本集中的每个训练样本包括目标症状和目标诊断;所述症状参考集合中的每个参考症状及所述诊断参考集合中的每个参考诊断均具有位置标识;/n将所述目标症状与所述症状参考集合中的参考症状进行匹配,将所述目标诊断与所述诊断参考集合中的参考诊断进行匹配,得到匹配结果;/n按照所述位置标识将所述匹配结果转换成用于表示病况的样本序列串集合;/n利用生成式对抗网络GAN的生成器,生成伪序列串集合;/n将训练样本集和所述训练样本集中每个训练样本对应的诊断结果输入到所述GAN的判别器,所述训练样本集包括获取的样本序列串集合和所述伪序列串集合,利用所述训练样本集及所述对应的诊断结果对所述判别器进行训练,得到诊断结果识别模型,所述诊断结果识别模型用于对临床决策支持系统CDSS输出的诊断结果进行识别,以得到识别结果。/n

【技术特征摘要】
1.一种诊断结果识别模型训练的方法,其特征在于,包括:
获取参考数据集及样本数据集;所述参考数据集包括症状参考集合和诊断参考集合,所述训练样本集中的每个训练样本包括目标症状和目标诊断;所述症状参考集合中的每个参考症状及所述诊断参考集合中的每个参考诊断均具有位置标识;
将所述目标症状与所述症状参考集合中的参考症状进行匹配,将所述目标诊断与所述诊断参考集合中的参考诊断进行匹配,得到匹配结果;
按照所述位置标识将所述匹配结果转换成用于表示病况的样本序列串集合;
利用生成式对抗网络GAN的生成器,生成伪序列串集合;
将训练样本集和所述训练样本集中每个训练样本对应的诊断结果输入到所述GAN的判别器,所述训练样本集包括获取的样本序列串集合和所述伪序列串集合,利用所述训练样本集及所述对应的诊断结果对所述判别器进行训练,得到诊断结果识别模型,所述诊断结果识别模型用于对临床决策支持系统CDSS输出的诊断结果进行识别,以得到识别结果。


2.根据权利要求1所述的方法,其特征在于,所述将所述目标症状与所述症状参考集合中的参考症状进行匹配,将所述目标诊断与所述诊断参考集合中的参考诊断进行匹配,包括:
将所述目标症状进行术语转换,得到用于表示所述目标症状的症状术语;
将所述症状术语与所述症状参考集合中的参考症状进行匹配;及将所述目标诊断与所述诊断参考集合中的参考诊断进行匹配;
确定在所述症状参考集合中与所述症状术语相匹配的目标参考症状;及确定在所述诊断参考集合中与所述症状术语相匹配的目标参考诊断。


3.根据权利要求1或2所述的方法,其特征在于,所述匹配结果包括目标参考症状和目标参考诊断;所述按照所述位置标识将所述匹配结果转换成用于表示病况的样本序列串集合,包括:
根据位置标识确定所述目标参考症状和所述目标参考诊断在所述参考数据集中的目标位置;
在所述目标位置标注第一标识;在所述参考数据集中的每个所述参考症状及每个所述参考诊断所对应的位置中,除了所述目标位置之外,均标注第二标识;
按照所述位置标识确定所述用于表示病况的样本序列串,所述样本序列串包括所述第一标识和所述第二标识。


4.根据权利要求1所述的方法,其特征在于,将训练样本集和所述训练样本集中每个训练样本对应的诊断结果输入到所述GAN的判别器,利用所述训练样本集及所述对应的诊断结果对所述判别器进行训练,得到诊断结果识别模型,包括:
将第一诊断输入到所述生成模型,所述生成模型输出第一序列串,所述第一序列串包括第一预置数量的用于表示症状的第一症状序列和第二预置数量的用于表示诊断的第一诊断序列;
将获取到的样本序列串集合中的样本序列串及该样本序列串对应的诊断结果,或者,将所述伪序列串集合中的伪序列串及该伪序列串对应的诊断结果输入到所述判别器,得到分类结果,所述分类结果用于指示诊断结果的概率;
根据所述分类结果更新所述诊断结果识别模型的参数,得到所述诊断结果识别模型。


5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
设置所述生成器的初始参数;
将所述训练数据集输入到所述生成器;
通过对所述训练数据集的学习和所述分类结果,更新所述初始参数,得到所述生成模型。...

【专利技术属性】
技术研发人员:朱昭苇孙行智胡岗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1