一种基于卷积神经网络的诊疗科室推荐方法及系统技术方案

技术编号:19430025 阅读:44 留言:0更新日期:2018-11-14 11:32
本发明专利技术公开了一种基于卷积神经网络的诊疗科室推荐方法及系统,该方法包含以下步骤:建立样本集、创建词典、数值矩阵化样本、构建神经网络模型、训练神经网络模型、模型选择及模型推荐。本发明专利技术的基于卷积神经网络的诊疗科室推荐方法及系统能够针对一段患者症状描述文本,推荐与之契合的医院诊疗科室,可用于智能导诊系统中,提高导诊效率。

【技术实现步骤摘要】
一种基于卷积神经网络的诊疗科室推荐方法及系统
本专利技术涉及医疗服务
,特别涉及一种基于卷积神经网络的诊疗科室推荐方法及系统。
技术介绍
随着科技的进步和医学的发展,医院诊疗科室设置也更加专业化和细分化。然而,这却给用户就医挂号时选择科室带来一定困扰,于是一些医院尤其是大型医院均增设了导诊环节,包括导诊服务人员和导诊自助系统等,其主要功能之一就是为患者推荐诊疗科室。传统的导诊系统通常是基于规则库构建的专家系统,需要用户按照系统的引导一步步输入各种患者症状描述,然后为用户输出对应的就诊科室。但是,专家系统的构建要求相关开发人员掌握大量专业的导诊知识并编码出庞大的规则库,要求较高且任务繁重,另外用户使用专家系统进行导诊时,需严格按照系统引导一步步输入患者症状描述,较为机械和繁琐,并不便于用户使用。
技术实现思路
本专利技术的目的是克服上述
技术介绍
中不足,提供一种基于卷积神经网络的诊疗科室推荐方法及系统,通过基于大数据和神经网络的系统在输出准确率(精度)等性能指标方面可以超越现有的专家系统,且构建时不需要专业领域人员编写规则库,而是让计算机从大数据中自行学习输入到输出的映射,使得系统构建更加简便,同时用户使用时只需一次性输入患者症状描述,本专利技术的系统便给出推荐结果,使得用户的使用更加便捷。为了达到上述的技术效果,本专利技术采取以下技术方案:一种基于卷积神经网络的诊疗科室推荐方法,包含以下步骤:S1.建立样本集:收集若干患者症状描述文本及其对应的就诊科室名称文本构成样本集,并从所述样本集中抽取a%的样本构成验证集,其余样本则构成训练集;a优选取值为5,S2.创建词典:对所述样本集中所有文本进行分词,选取其中出现次数大于N次的词构成词典,同时向词典中添加一个特殊词<UKN>,所述<UKN>表示词典未包括的所有词汇;S3.数值矩阵化样本:基于所述词典,将样本集中每一条文本转化成尺寸相同的数值矩阵;S4.构建神经网络模型,且所述神经网络模型包括依次连接的词嵌入层、卷积层、池化层、全连接层;S5.训练神经网络模型:对步骤S4中的神经网络模型参数初始化后,基于训练集的数据迭代优化神经网络模型参数,得到一个训练后的模型,改变参数初始化,如此训练M次,得到M个训练后的模型,其中,训练结束条件为每个样本平均参与迭代的次数大于等于A次,具体的,优选M大于等于1并小于等于5,A大于等于200;S6.模型选择:利用验证集评估上述M个训练后的模型的性能,选择其中预测精度最高的一个模型用于诊疗科室推荐;S7.利用步骤S3将任意患者的症状描述文本转化为数值矩阵化样本,然后将该数值矩阵化样本输入步骤S6中选择的模型中计算得到推荐的诊疗科室标签,进而得到推荐的诊疗科室名称;本专利技术的方法能够针对一段患者症状描述文本,推荐与之契合的医院诊疗科室,可用于智能导诊系统中,提高导诊效率,该方法首先从文本中提取关键词,然后获取关键词的向量空间表示,再将这些词向量输入多层卷积神经网络并输出文本特征,最后将文本特征输入softmax分类器并输出推断概率最大的诊疗科室标签,且上述词向量空间、卷积神经网络的参数是通过收集的训练数据进行机器学习得到的。进一步地,所述步骤S3具体包含以下步骤:S3.1设定矩阵尺寸为[1,D],其中,D为正整数;优选D为大于等于5的正整数;S3.2对每条文本进行分词,得到K个词,如果K>D,则截取K个词中前D个词构成分词列表,否则,则在K个词后填充(D-K)个<UKN>构成分词列表;S3.3针对分词列表中的每个词从所述词典中查询得到该词对应的索引值,所述索引值为非负整数,并将分词列表映射成相应的数值矩阵,矩阵尺寸即为[1,D]。进一步地,所述步骤S4中所述词嵌入层通过线性变换实现将输入大小为[1,D]的数值矩阵embed_input映射到大小为[D,embed_size]的数值矩阵embed_output,其中embed_size为正整数。进一步地,所述卷积层包括三种类型的卷积核,三种类型的卷积核的尺寸大小分别为[3,embed_size]、[4,embed_size]、[5,embed_size],且每种卷积核的数量用FILTERS_NUM表示。进一步地,所述卷积层的计算过程如下:步骤一:设某一卷积核Filter的权重参数为矩阵WF、偏置参数为标量bf,WF的尺寸为[filter_size,embed_size],filter_size取值来自于集合[3,4,5]中某一值;步骤二:卷积核Filter沿输入矩阵的第一个维度做窄卷积计算,窗口滑动步幅取1,得到矩阵CF,CF的尺寸为[D-fiter_size+1,1];步骤三:计算fc(CF+bf),fc为激活函数RELU,得到矩阵CA,其尺寸与CF一致;步骤四:对所有卷积核重复前述计算步骤。进一步地,所述池化层对每个卷积核的CA取最大值,组合得到的最大值得到特征矩阵FV,FV的尺寸为[FILTERS_NUM,1]。进一步地,所述步骤S4中全连接层将完成如下计算:步骤一:通过线性变换SC=FV·Wcf+Bcf将特征空间的分布式特征FV映射成样本标签空间的分数向量SC;其中Wcf为全连接权重矩阵,Bcf为全连接偏置矩阵,SC的尺寸为[CLASSES_NUM,1],CLASSES_NUM表示从样本集中获取的诊疗科室种类数量,Wcf的尺寸为[FILTERS_NUMCLASSES_NUM],Bcf的尺寸为[CLASSES_NUM,1];步骤二:基于softmax函数将SC映射为具有概率意义的矩阵LABELS_HAT,其尺寸为[CLASSES_NUM,1]。进一步地,所述步骤S5中训练神经网络模型采用交叉熵作为损失函数,采用随机梯度下降法作为参数优化算法,在全连接层采用dropout方法来防止模型过拟合,优选dropout概率取0.5。进一步地,所述步骤S7中取LABELS_HAT中最大值所对应的索引值表示模型推荐的诊疗科室标签。同时,本专利技术还公开了一种基于卷积神经网络的诊疗科室推荐系统,包括以下单元:文本分词单元,用于对每条患者症状描述文本进行分词;词典创建单元,用于根据样本集创建词典;数值化单元,用于根据词典将分词列表转化为数值矩阵;标签处理单元,用于建立诊疗科室名称文本与其数值标签之间的映射;样本划分单元,用于将样本集划分为测试集和验证集;模型创建单元,用于创建卷积神经网络模型结构,由词嵌入层、卷积层、池化层、全连接层组成;模型训练单元,用于初始化模型参数并基于训练集对模型参数进行迭代优化;模型选择单元,用于根据验证集数据评估训练后模型的性能,并选择性能最优的模型;模型推荐单元,用于根据输入文本输出推断概率最大的诊疗科室标签;其中,所述文本分词单元分别与数值化单元及词典创建单元相连,数值化单元分别与词典创建单、样本划分单元及模型推荐单元相连,样本划分单元分别与标签处理单元、模型训练单元、模型选择单元相连,模型推荐单元分别与模型选择单元、标签处理单元相连,模型训练单元分别与模型创建单元、模型选择单元相连。本专利技术与现有技术相比,具有以下的有益效果:本专利技术的基于卷积神经网络的诊疗科室推荐方法及系本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的诊疗科室推荐方法,其特征在于,包含以下步骤:S1.建立样本集:收集若干患者症状描述文本及其对应的就诊科室名称文本构成样本集,并从所述样本集中抽取a%的样本构成验证集,其余样本则构成训练集;S2.创建词典:对所述样本集中所有文本进行分词,选取其中出现次数大于N次的词构成词典,同时向词典中添加一个特殊词

【技术特征摘要】
1.一种基于卷积神经网络的诊疗科室推荐方法,其特征在于,包含以下步骤:S1.建立样本集:收集若干患者症状描述文本及其对应的就诊科室名称文本构成样本集,并从所述样本集中抽取a%的样本构成验证集,其余样本则构成训练集;S2.创建词典:对所述样本集中所有文本进行分词,选取其中出现次数大于N次的词构成词典,同时向词典中添加一个特殊词<UKN>,所述<UKN>表示词典未包括的所有词汇;S3.数值矩阵化样本:基于所述词典,将样本集中每一条文本转化成尺寸相同的数值矩阵;S4.构建神经网络模型,且所述神经网络模型包括依次连接的词嵌入层、卷积层、池化层、全连接层;S5.训练神经网络模型:对步骤S4中的神经网络模型参数初始化后,基于训练集的数据迭代优化神经网络模型参数,得到一个训练后的模型,改变参数初始化,如此训练M次,得到M个训练后的模型,其中,训练结束条件为每个样本平均参与迭代的次数大于等于A次;S6.模型选择:利用验证集评估上述M个训练后的模型的性能,选择其中预测精度最高的一个模型用于诊疗科室推荐;S7.利用步骤S3将任意患者的症状描述文本转化为数值矩阵化样本,然后将该数值矩阵化样本输入步骤S6中选择的模型中计算得到推荐的诊疗科室标签,进而得到推荐的诊疗科室名称。2.根据权利要求1所述的一种基于卷积神经网络的诊疗科室推荐方法,其特征在于,所述步骤S3具体包含以下步骤:S3.1设定矩阵尺寸为[1,D],其中,D为正整数;S3.2对每条文本进行分词,得到K个词,如果K>D,则截取K个词中前D个词构成分词列表,否则,则在K个词后填充(D-K)个<UKN>构成分词列表;S3.3针对分词列表中的每个词从所述词典中查询得到该词对应的索引值,所述索引值为非负整数,并将分词列表映射成相应的数值矩阵,矩阵尺寸即为[1,D]。3.根据权利要求2所述的一种基于卷积神经网络的诊疗科室推荐方法,其特征在于,所述步骤S4中所述词嵌入层通过线性变换实现将输入大小为[1,D]的数值矩阵embed_input映射到大小为[D,embed_size]的数值矩阵embed_output,其中embed_size为正整数。4.根据权利要求3所述的一种基于卷积神经网络的诊疗科室推荐方法,其特征在于,所述卷积层包括三种类型的卷积核,三种类型的卷积核的尺寸大小分别为[3,embed_size]、[4,embed_size]、[5,embed_size],且每种卷积核的数量用FILTERS_NUM表示。5.根据权利要求4所述的一种基于卷积神经网络的诊疗科室推荐方法,其特征在于,所述卷积层的计算过程如下:步骤一:设某一卷积核Filter的权重参数为矩阵WF、偏置参数为标量bf,WF的尺寸为[filter_size,embed_siz...

【专利技术属性】
技术研发人员:周杨刘传银杨峰梁庆真刘贤洪
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1