识别病情陈述中疾病参考信息的装置、方法、设备及介质制造方法及图纸

技术编号:22389053 阅读:21 留言:0更新日期:2019-10-29 07:00
本发明专利技术公开了一种识别病情陈述中疾病参考信息的装置、方法、设备及介质,包括:预处理模块,用于对病情陈述的描述文本进行文本预处理操作,并将描述文本表示为词向量形式;第一提取模块,用于从词向量形式的描述文本中提取出描述文本的初始特征;第二提取模块,用于将初始特征输入到预先训练的CNN模型中,提取出描述文本的深层次特征;分类模块,用于根据深层次特征使用Softmax分类器进行分类,得出疾病参考信息的分类结果。本发明专利技术根据描述文本中的初始特征,利用预设CNN模型自动提取深层次特征,进一步利用深层次特征得到疾病参考信息的分类结果,实现疾病症状的自动获取,为医生疾病诊断提供参考,极大提高就诊效率。

【技术实现步骤摘要】
识别病情陈述中疾病参考信息的装置、方法、设备及介质
本专利技术涉及机器学习
,特别是涉及一种识别病情陈述中疾病参考信息的装置、方法、设备及存储介质。
技术介绍
近几年基于机器学习的疾病诊断研究所用的训练和测试集都集中在某类疾病的临床资料或电子病历,电子病历的特点是具有丰富的特征属性,利用机器学习挖掘特征信息可以取得较好的诊断效果。此外,上述的诊断系统主要用于医生的辅助诊断,帮助医生做出更准确的医疗决策。然而应用于用户的疾病自诊的研究相当匮乏,疾病自诊模型所采用的训练集是医生对患者问诊时的对话数据,其中包含了用户的症状和体征信息,疾病自诊便是从对话数据中挖掘疾病信息的过程,因为只有症状和体征信息,缺乏临床检查指标,使得疾病诊断的正确率不太理想,但是疾病自诊却可以帮助用户在身体感到不适时,可以在家里就很快捷方便地依据智能诊断系统获得一个参考的诊断结果,方便患者及时了解自己身体状况,避免错过就医最佳时间。鉴于此,提供一种从病情陈述中识别出疾病参考信息,以结合疾病参考信息进一步辅助医生进行诊断分类的技术是非常有必要的。
技术实现思路
本专利技术的目的是提供一种识别病情陈述中疾病参考信息的装置、方法、设备及存储介质,能够为医生提供辅助诊断的疾病参考信息,提高识别疾病参考信息的结果的准确度。为解决上述技术问题,本专利技术提供一种识别病情陈述中疾病参考信息的装置,该装置包括:预处理模块,用于对病情陈述的描述文本进行文本预处理操作,并将所述描述文本表示为词向量形式;第一提取模块,用于从所述词向量形式的描述文本中提取出描述文本的初始特征;第二提取模块,用于将所述初始特征输入到预先训练的CNN模型中,提取出所述描述文本的深层次特征;分类模块,用于根据所述深层次特征使用Softmax分类器进行分类,得出疾病参考信息的分类结果。可选的,所述预处理模块用于:对所述描述文本进行文本分词处理操作以及去停用词处理操作。可选的,所述第一提取模块用于:利用Word2vec的skip-gram模型从经过文本预处理操作的所述描述文本中提取出描述文本的初始特征。可选的,所述分类模块用于:经过K-max池化操作,根据所述深层次特征使用Softmax分类器进行分类,得出疾病参考信息的分类结果。为实现上述目的,本专利技术还提供了一种识别病情陈述中疾病参考信息的方法,包括:对病情陈述的描述文本进行文本预处理操作,并将所述描述文本表示为词向量形式;从所述词向量形式的描述文本中提取出描述文本的初始特征;将所述初始特征输入到预先训练的CNN模型中,提取出所述描述文本的深层次特征;根据所述深层次特征使用Softmax分类器进行分类,得出疾病参考信息的分类结果。可选的,所述对病情陈述的描述文本进行文本预处理操作包括:对所述描述文本进行文本分词处理操作以及去停用词处理操作。可选的,所述从经过文本预处理操作的所述描述文本中提取出描述文本的初始特征包括:利用Word2vec的skip-gram模型从经过文本预处理操作的所述描述文本中提取出描述文本的初始特征。可选的,所述根据所述深层次特征使用Softmax分类器进行分类,得出疾病参考信息的分类结果包括:经过K-max池化操作,根据所述深层次特征使用Softmax分类器进行分类,得出疾病参考信息的分类结果。为实现上述目的,本专利技术还提供了一种识别病情陈述中疾病参考信息的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现前述公开的任一种识别病情陈述中疾病参考信息的方法的步骤。为实现上述目的,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述公开的任一种识别病情陈述中疾病参考信息的方法的步骤。本专利技术所提供的识别病情陈述中疾病参考信息的装置,包括:预处理模块,用于对病情陈述的描述文本进行文本预处理操作,并将所述描述文本表示为词向量形式;第一提取模块,用于从所述词向量形式的描述文本中提取出描述文本的初始特征;第二提取模块,用于将所述初始特征输入到预先训练的CNN模型中,提取出所述描述文本的深层次特征;分类模块,用于根据所述深层次特征使用Softmax分类器进行分类,得出疾病参考信息的分类结果。本专利技术通过提取描述文本中的初始特征,进一步根据初始特征,利用预设CNN模型自动提取其中的深层次特征,进一步利用深层次特征得到疾病参考信息的分类结果,从而实现疾病症状的自动获取,为医生疾病诊断提供参考,极大提高就诊效率。本专利技术还提供了识别病情陈述中疾病参考信息的方法、设备及存储介质,同样能实现上述技术效果。附图说明为了更清楚的说明本专利技术实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术所提供的识别病情陈述中疾病参考信息的装置的结构框图;图2为本专利技术所提供的识别病情陈述中疾病参考信息的方法的流程图;图3为词向量的训练过程示意图;图4为卷积神经网络结构示意图;图5为本专利技术所提供的识别病情陈述中疾病参考信息的设备的结构框图;图6为本专利技术所提供的另一种识别病情陈述中疾病参考信息的设备的结构框图。具体实施方式现如今,病情陈述的文本量随着问诊的进行逐渐堆积,在问诊的后期,疾病分类的对象不再是短文本,而是由对话内容累加产生的长文本,那么短文本中特征稀疏的问题随着文本长度增加而不存在了,但是长文本的疾病分类又遇到了新的问题:由于文本噪声和特征不稀疏所导致传统的机器学习方法的分类精确度不高、学习深度不够等问题。本专利技术的核心是提供一种识别病情陈述中疾病参考信息的装置、方法、设备及存储介质。为了使本
的人员更好地理解本专利技术方案,下面结合附图和具体实施方式对本专利技术作进一步的详细说明。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供了一种识别病情陈述中疾病参考信息的装置,参见图1,所述装置包括:预处理模块100,用于对病情陈述的描述文本进行文本预处理操作,并将所述描述文本表示为词向量形式;本实施例中,通过预处理模块对病情陈述的描述文本进行预处理,并将描述文本利用词向量形式表示。具体地,将预处理后的描述文本表示为n×k形式的词向量矩阵,其中,n表示矩阵的行,每一行对应于一个分词元素,一般是一个单词,也可以是一个字符,也即,每一行表示一个单词的向量;k表示每行单词的k维语义向量。第一提取模块200,用于从所述词向量形式的描述文本中提取出描述文本的初始特征;将描述文本利用词向量形式表示后,本实施例提取文本中的初始特征。具体地,可以利用Word2vec的skip-gram模型从经过文本预处理操作的所述描述文本中提取出描述文本的初始特征。第二提取模块300,用于将所述初始特征输入到预先训练的CNN模型中,提取出所述描述文本的深层次特征;本实施例中,预先训练了CNN模型,从而利用CNN模型获取到初始特征,并从中提取出深层次特征。其中,CNN模型可以基于卷本文档来自技高网
...

【技术保护点】
1.一种识别病情陈述中疾病参考信息的装置,其特征在于,包括:预处理模块,用于对病情陈述的描述文本进行文本预处理操作,并将所述描述文本表示为词向量形式;第一提取模块,用于从所述词向量形式的描述文本中提取出描述文本的初始特征;第二提取模块,用于将所述初始特征输入到预先训练的CNN模型中,提取出所述描述文本的深层次特征;分类模块,用于根据所述深层次特征使用Softmax分类器进行分类,得出疾病参考信息的分类结果。

【技术特征摘要】
1.一种识别病情陈述中疾病参考信息的装置,其特征在于,包括:预处理模块,用于对病情陈述的描述文本进行文本预处理操作,并将所述描述文本表示为词向量形式;第一提取模块,用于从所述词向量形式的描述文本中提取出描述文本的初始特征;第二提取模块,用于将所述初始特征输入到预先训练的CNN模型中,提取出所述描述文本的深层次特征;分类模块,用于根据所述深层次特征使用Softmax分类器进行分类,得出疾病参考信息的分类结果。2.如权利要求1所述的识别病情陈述中疾病参考信息的装置,其特征在于,所述预处理模块用于:对所述描述文本进行文本分词处理操作以及去停用词处理操作。3.如权利要求1或2所述的识别病情陈述中疾病参考信息的装置,其特征在于,所述第一提取模块用于:利用Word2vec的skip-gram模型从经过文本预处理操作的所述描述文本中提取出描述文本的初始特征。4.如权利要求3所述的识别病情陈述中疾病参考信息的装置,其特征在于,所述分类模块用于:经过K-max池化操作,根据所述深层次特征使用Softmax分类器进行分类,得出疾病参考信息的分类结果。5.一种识别病情陈述中疾病参考信息的方法,其特征在于,包括:对病情陈述的描述文本进行文本预处理操作,并将所述描述文本表示为词向量形式;从所述词向量形式的描述文本中提取出描述文本的初始特征;将所述初始特征输入到预先训练的CNN模...

【专利技术属性】
技术研发人员:董文华
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1