诊断结果识别、模型训练的方法、计算机设备及存储介质技术

技术编号：23364308 阅读：40 留言：0更新日期：2020-02-18 17:51

本发明专利技术公开了诊断结果识别、模型训练的方法、计算机设备及存储介质，该方法包括：获取参考数据集及样本数据集；参考数据集包括症状参考集合和诊断参考集合，训练样本集中的每个训练样本包括目标症状和目标诊断；将目标症状与症状参考集合中的参考症状进行匹配，将目标诊断与诊断参考集合中的参考诊断进行匹配，得到匹配结果；按照位置标识将匹配结果转换成用于表示病况的样本序列串集合；利用生成式对抗网络GAN的生成器，生成伪序列串集合；将训练样本集和训练样本集中每个训练样本对应的诊断结果输入到判别器，得到诊断结果识别模型。诊断结果识别模型用于对临床决策支持系统CDSS输出的诊断结果进行识别，以降低CDSS输出的诊断结果的误诊率。

Diagnosis result recognition, model training method, computer equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
诊断结果识别、模型训练的方法、计算机设备及存储介质
本专利技术涉及机器学习
，尤其涉及一种诊断结果识别、模型训练的方法、计算机设备及存储介质。
技术介绍
目前，人工智能技术已经在生活中有了较广泛的应用，其中也涉及到医疗领域。人工智能在医学领域一个非常重要的应用是临床决策支持系统(ClinicalDecisionSupportSystem,CDSS)，CDSS包括临床辅助诊断系统，临床辅助诊断系统旨在根据患者的症状等信息给出疑似诊断。目前CDSS系统采用的诊断模型一般为概率模型，传统机器学习模型，深度网络模型等。这些模型在一些输入场景下能表现出很好的效果，但是不可否认的是无论哪种模型，都会在一些场景下表现失常(尤其是概率模型)，会给出不合逻辑的甚至是错误的结果，即误诊。误诊会给CDSS用户和患者带来极大的不便甚至危害，应该尽量避免。目前的CDSS系统最常见的误诊控制方法是通过制定一些规则来过滤诊断结果，如根据性别过滤不合理的诊断，规则的数量有限，比较局限，因此对质控效果贡献不大。
技术实现思路
本专利技术实施例提供一种诊断结果识别、模型训练的方法、计算机设备及存储介质，用于降低CDSS输出的诊断结果的误诊率。第一方面，本专利技术实施例提供了一种诊断结果识别模型训练的方法，包括：获取参考数据集及样本数据集；所述参考数据集包括症状参考集合和诊断参考集合，所述训练样本集中的每个训练样本包括目标症状和目标诊断；所述症状参考集合中的每个参考症状及所述诊断参考集合中的每个参...

【技术保护点】
1.一种诊断结果识别模型训练的方法，其特征在于，包括：/n获取参考数据集及样本数据集；所述参考数据集包括症状参考集合和诊断参考集合，所述训练样本集中的每个训练样本包括目标症状和目标诊断；所述症状参考集合中的每个参考症状及所述诊断参考集合中的每个参考诊断均具有位置标识；/n将所述目标症状与所述症状参考集合中的参考症状进行匹配，将所述目标诊断与所述诊断参考集合中的参考诊断进行匹配，得到匹配结果；/n按照所述位置标识将所述匹配结果转换成用于表示病况的样本序列串集合；/n利用生成式对抗网络GAN的生成器，生成伪序列串集合；/n将训练样本集和所述训练样本集中每个训练样本对应的诊断结果输入到所述GAN的判别器，所述训练样本集包括获取的样本序列串集合和所述伪序列串集合，利用所述训练样本集及所述对应的诊断结果对所述判别器进行训练，得到诊断结果识别模型，所述诊断结果识别模型用于对临床决策支持系统CDSS输出的诊断结果进行识别，以得到识别结果。/n

【技术特征摘要】
1.一种诊断结果识别模型训练的方法，其特征在于，包括：
获取参考数据集及样本数据集；所述参考数据集包括症状参考集合和诊断参考集合，所述训练样本集中的每个训练样本包括目标症状和目标诊断；所述症状参考集合中的每个参考症状及所述诊断参考集合中的每个参考诊断均具有位置标识；
将所述目标症状与所述症状参考集合中的参考症状进行匹配，将所述目标诊断与所述诊断参考集合中的参考诊断进行匹配，得到匹配结果；
按照所述位置标识将所述匹配结果转换成用于表示病况的样本序列串集合；
利用生成式对抗网络GAN的生成器，生成伪序列串集合；
将训练样本集和所述训练样本集中每个训练样本对应的诊断结果输入到所述GAN的判别器，所述训练样本集包括获取的样本序列串集合和所述伪序列串集合，利用所述训练样本集及所述对应的诊断结果对所述判别器进行训练，得到诊断结果识别模型，所述诊断结果识别模型用于对临床决策支持系统CDSS输出的诊断结果进行识别，以得到识别结果。

2.根据权利要求1所述的方法，其特征在于，所述将所述目标症状与所述症状参考集合中的参考症状进行匹配，将所述目标诊断与所述诊断参考集合中的参考诊断进行匹配，包括：
将所述目标症状进行术语转换，得到用于表示所述目标症状的症状术语；
将所述症状术语与所述症状参考集合中的参考症状进行匹配；及将所述目标诊断与所述诊断参考集合中的参考诊断进行匹配；
确定在所述症状参考集合中与所述症状术语相匹配的目标参考症状；及确定在所述诊断参考集合中与所述症状术语相匹配的目标参考诊断。

3.根据权利要求1或2所述的方法，其特征在于，所述匹配结果包括目标参考症状和目标参考诊断；所述按照所述位置标识将所述匹配结果转换成用于表示病况的样本序列串集合，包括：
根据位置标识确定所述目标参考症状和所述目标参考诊断在所述参考数据集中的目标位置；
在所述目标位置标注第一标识；在所述参考数据集中的每个所述参考症状及每个所述参考诊断所对应的位置中，除了所述目标位置之外，均标注第二标识；
按照所述位置标识确定所述用于表示病况的样本序列串，所述样本序列串包括所述第一标识和所述第二标识。

4.根据权利要求1所述的方法，其特征在于，将训练样本集和所述训练样本集中每个训练样本对应的诊断结果输入到所述GAN的判别器，利用所述训练样本集及所述对应的诊断结果对所述判别器进行训练，得到诊断结果识别模型，包括：
将第一诊断输入到所述生成模型，所述生成模型输出第一序列串，所述第一序列串包括第一预置数量的用于表示症状的第一症状序列和第二预置数量的用于表示诊断的第一诊断序列；
将获取到的样本序列串集合中的样本序列串及该样本序列串对应的诊断结果，或者，将所述伪序列串集合中的伪序列串及该伪序列串对应的诊断结果输入到所述判别器，得到分类结果，所述分类结果用于指示诊断结果的概率；
根据所述分类结果更新所述诊断结果识别模型的参数，得到所述诊断结果识别模型。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：
设置所述生成器的初始参数；
将所述训练数据集输入到所述生成器；
通过对所述训练数据集的学习和所述分类结果，更新所述初始参数，得到所述生成模型。...

【专利技术属性】
技术研发人员：朱昭苇，孙行智，胡岗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人