基于医疗概率图的信息分类方法、装置及设备制造方法及图纸

技术编号:22419163 阅读:21 留言:0更新日期:2019-10-30 02:17
本发明专利技术实施例提供一种基于医疗概率图的信息分类方法、装置及设备,该方法包括:获取症状描述信息,所述症状描述信息包括至少一个描述要素;根据医疗概率图确定各所述描述要素对应的不同症状类型的概率;其中,所述医疗概率图是根据至少两种概率模型对相同的医疗语料进行处理得到的概率结果确定的;根据各所述描述要素对应的不同症状类型的概率,确定所述症状描述信息对应的症状类型;本实施例中的医疗概率图是根据多个概率模型对相同的医疗语料进行处理得到的,一方面,保证了医疗概率图中各节点之间转移概率的准确性,提高了信息分类的准确率;另一方面,无需医疗人员手工标注,降低了构建医疗概率图的时间成本和人力成本。

【技术实现步骤摘要】
基于医疗概率图的信息分类方法、装置及设备
本专利技术实施例涉及智能医疗
,尤其涉及一种基于医疗概率图的信息分类方法、装置及设备。
技术介绍
医疗概率图在信息分类中起重要作用。医疗概率图包括多种类型的医疗实体节点,以及不同类型的医疗实体节点之间的转移概率。在构建概率图的过程中,一个关键的步骤就是确定两个节点间的转移概率。目前,通常采用的方式是人工标注转移概率,具体的,医学专业人员根据自身的学习积累或临床经验确定两个实体节点之间的转移概率值。然而,上述方式受限于标注人员的专业水平,无法保证概率标注的准确性,使得利用医疗概率图进行信息分类的准确性较低。
技术实现思路
本专利技术实施例提供一种基于医疗概率图的信息分类方法、装置及设备,能够保证医疗概率图的转移概率的准确性,从而提高信息分类的准确性。第一方面,本专利技术实施例提供一种基于医疗概率图的信息分类方法,包括:获取症状描述信息,所述症状描述信息包括至少一个描述要素;根据医疗概率图确定各所述描述要素对应的不同症状类型的概率;其中,所述医疗概率图是根据至少两种概率模型对相同的医疗语料进行处理得到的概率结果确定的;根据各所述描述要素对应的不同症状类型的概率,确定所述症状描述信息对应的症状类型。可选的,所述根据各所述描述要素对应的不同症状类型的概率,确定所述症状描述信息对应的症状类型,包括:针对所述医疗概率图中的每个症状类型,根据各所述描述要素对应所述症状类型的概率,得到各所述描述要素对应所述症状类型的概率之和;将所述概率之和满足预设条件的症状类型,作为所述症状描述信息对应的症状类型。可选的,所述根据医疗概率图确定各所述描述要素对应的症状类型的概率之前,所述方法还包括:对所述医疗语料进行自然语言处理,得到医疗实体,所述医疗实体包括症状类型和描述要素;通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,所述概率结果包括各实体对的转移概率,所述实体对的转移概率为描述要素与症状类型之间的转移概率;根据每种概率模型的权重,以及各所述概率模型针对同一实体对输出的概率结果,构建所述医疗概率图。可选的,所述根据每种概率模型的权重,以及各所述概率模型针对同一实体对输出的概率结果,构建所述医疗概率图之前,所述方法还包括:获取测试集,所述测试集包括测试医疗实体和标准概率结果;通过所述至少两种概率模型分别对所述测试医疗实体进行处理,得到每种概率模型输出的测试概率结果;针对同一实体对,根据所述标准概率结果和每种概率模型输出的测试概率结果,确定各所述概率模型的权重。可选的,所述根据所述标准概率结果和每种概率模型输出的测试概率结果,确定各所述概率模型的权重,包括:根据所述标准概率结果和每种概率模型输出的测试概率结果,确定各所述概率模型对应的准确率;根据各所述概率模型对应的准确率,确定各所述概率模型的权重,其中,所述准确率与所述权重成正比。可选的,所述通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,包括:若所述概率模型为基于共现频次的概率模型,则根据所述医疗语料获取症状类型与各所述描述要素的共现频次;针对每个实体对,根据所述实体对中的症状类型与描述要素的共现频次,以及症状类型与各描述要素的共现频次之和,获取所述实体对的转移概率。可选的,所述通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,包括:若所述概率模型为基于词频和逆文本频率的概率模型,则获取所述实体对中的症状类型与描述要素的共现频次、所述实体对中的症状类型与描述要素的共现频次,以及所述医疗语料的数量;针对每个实体对,根据所述实体对中的症状类型与描述要素的共现频次、所述实体对中的症状类型与描述要素的共现频次,以及所述医疗语料的数量,获取所述实体对的转移概率。可选的,所述通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,包括:若所述概率模型为基于信息增益的概率模型,则针对每个实体对,获取所述医疗语料中包括症状类型的第一概率、所述医疗语料中包括描述要素的第二概率、所述医疗语料不包括描述要素的第三概率、所述医疗语料中包括所述描述要素的情况下也包括所述症状类型的第一条件概率、所述医疗语料中不包括描述要素的情况下包括症状类型的第二条件概率;根据所述第一概率、所述第二概率、所述第三概率、所述第一条件概率和所述第二条件概率,获取所述实体对的转移概率。可选的,所述通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,包括:若所述概率模型为基于关联程度的概率模型,则针对每个实体对,获取所述医疗语料中同时出现症状类型与描述要素的第一语料的数量、所述医疗语料中不出现症状类型但是出现描述要素的第二语料的数量、所述医疗语料中出现症状类型但是不出现描述要素的第三语料的数量、以及所述医疗语料中既不出现症状类型也不出现描述要素的第四语料的数量:根据所述第一语料的数量、所述第二语料的数量、所述第三语料的数量、所述第四语料的数量以及所述医疗语料的总数量,获取所述实体对的转移概率。可选的,所述通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,包括:若所述概率模型为基于互信息的概率模型,则针对每个实体对,获取所述医疗语料中同时出现症状类型与描述要素的第一语料的数量、所述医疗语料中不出现症状类型但是出现描述要素的第二语料的数量、以及所述医疗语料中出现症状类型但是不出现描述要素的第三语料的数量;根据所述第一语料的数量、所述第二语料的数量、所述第三语料的数量以及所述医疗语料的总数量,获取所述实体对的转移概率。可选的,所述描述要素的类型包括如下中的至少一种:症状、体征、检验、用药、手术。第二方面,本专利技术实施例提供一种基于医疗概率图的信息分类装置,包括:获取模块,用于获取症状描述信息,所述症状描述信息包括至少一个描述要素;预测模块,用于根据医疗概率图确定各所述描述要素对应的不同症状类型的概率;其中,所述医疗概率图是根据至少两种概率模型对相同的医疗语料进行处理得到的概率结果确定的;所述预测模块,还用于根据各所述描述要素对应的不同症状类型的概率,确定所述症状描述信息对应的症状类型。可选的,所述预测模块具体用于:针对所述医疗概率图中的每个症状类型,根据各所述描述要素对应所述症状类型的概率,得到各所述描述要素对应所述症状类型的概率之和;将所述概率之和满足预设条件的症状类型,作为所述症状描述信息对应的症状类型。可选的,所述装置还包括构建模块,所述构建模块用于:对所述医疗语料进行自然语言处理,得到医疗实体,所述医疗实体包括症状类型和描述要素;通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,所述概率结果包括各实体对的转移概率,所述实体对的转移概率为描述要素与症状类型之间的转移概率;根据每种概率模型的权重,以及各所述概率模型针对同一实体对输出的概率结果,构建所述医疗概率图。可选的,所述构建模块还用于:获取测试集,所述测试集包括测试医疗实体和标准概率结果;通过所述至少两种概率模型分别对所述测试医疗实体进行处理,得到每种概率模型输出的测试概率结果;针对同一实体对,根据所本文档来自技高网...

【技术保护点】
1.一种基于医疗概率图的信息分类方法,其特征在于,包括:获取症状描述信息,所述症状描述信息包括至少一个描述要素;根据医疗概率图确定各所述描述要素对应的不同症状类型的概率;其中,所述医疗概率图是根据至少两种概率模型对相同的医疗语料进行处理得到的概率结果确定的;根据各所述描述要素对应的不同症状类型的概率,确定所述症状描述信息对应的症状类型。

【技术特征摘要】
1.一种基于医疗概率图的信息分类方法,其特征在于,包括:获取症状描述信息,所述症状描述信息包括至少一个描述要素;根据医疗概率图确定各所述描述要素对应的不同症状类型的概率;其中,所述医疗概率图是根据至少两种概率模型对相同的医疗语料进行处理得到的概率结果确定的;根据各所述描述要素对应的不同症状类型的概率,确定所述症状描述信息对应的症状类型。2.根据权利要求1所述的方法,其特征在于,所述根据各所述描述要素对应的不同症状类型的概率,确定所述症状描述信息对应的症状类型,包括:针对所述医疗概率图中的每个症状类型,根据各所述描述要素对应所述症状类型的概率,得到各所述描述要素对应所述症状类型的概率之和;将所述概率之和满足预设条件的症状类型,作为所述症状描述信息对应的症状类型。3.根据权利要求1所述的方法,其特征在于,所述根据医疗概率图确定各所述描述要素对应的症状类型的概率之前,所述方法还包括:对所述医疗语料进行自然语言处理,得到医疗实体,所述医疗实体包括症状类型和描述要素;通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,所述概率结果包括各实体对的转移概率,所述实体对的转移概率为描述要素与症状类型之间的转移概率;根据每种概率模型的权重,以及各所述概率模型针对同一实体对输出的概率结果,构建所述医疗概率图。4.根据权利要求3所述的方法,其特征在于,所述根据每种概率模型的权重,以及各所述概率模型针对同一实体对输出的概率结果,构建所述医疗概率图之前,所述方法还包括:获取测试集,所述测试集包括测试医疗实体和标准概率结果;通过所述至少两种概率模型分别对所述测试医疗实体进行处理,得到每种概率模型输出的测试概率结果;针对同一实体对,根据所述标准概率结果和每种概率模型输出的测试概率结果,确定各所述概率模型的权重。5.根据权利要求4所述的方法,其特征在于,所述根据所述标准概率结果和每种概率模型输出的测试概率结果,确定各所述概率模型的权重,包括:根据所述标准概率结果和每种概率模型输出的测试概率结果,确定各所述概率模型对应的准确率;根据各所述概率模型对应的准确率,确定各所述概率模型的权重,其中,所述准确率与所述权重成正比。6.根据权利要求3至5任一项所述的方法,其特征在于,所述通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,包括:若所述概率模型为基于共现频次的概率模型,则根据所述医疗语料获取症状类型与各所述描述要素的共现频次;针对每个实体对,根据所述实体对中的症状类型与描述要素的共现频次,以及症状类型与各描述要素的共现频次之和,获取所述实体对的转移概率。7.根据权利要求3至5任一项所述的方法,其特征在于,所述通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,包括:若所述概率模型为基于词频和逆文本频率的概率模型,则获取所述实体对中的症状类型与描述要素的共现频次、所述实体对中的症状类型与描述要素的共现频次,以及所述医疗语料的数量;针对每个实体对,根据所述实体对中的症状类型与描述要素的共现频次、所述实体对中的症状类型与描述要素的共现频次,以及所述医疗语料的数量,获取所述实体对的转移概率。8.根据权利要求3至5任一项所述的方法,其特征在于,所述通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,包括:若所述概率模型为基于信息增益的概率模型,则针对每个实体对,获取所述医疗语料中包括症状类型的第一概率、所述医疗语料中包括描述要素的第二概率、所述医疗语料不包括描述要素的第三概率、所述医疗语料中包括所述描述要素的情况下也包括所述症状类型的第一条件概率、所述医疗语料中不包括描述要素的情况下包括症状类型的第二条件概率;根据所述第一概率、所述第二概率、所述第三概率、所述第一条件概率和所述第二条件概率,获取所述实体对的转移概率。9.根据权利要求3至5任一项所述的方法,其特征在于,所述通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,包括:若所述概率模型为基于关联程度的概率模型,则针对每个实体对,获取所述医疗语料中同时出现症状类型与描述要素的第一语料的数量、所述医疗语料中不出现症状类型但是出现描述要素的第二语料的数量、所述医疗语料中出现症状类型但是不出现描述要素的第三语料的数量、以及所述医疗语料中既不出现症状类型也不出现描述要素的第四语料的数量:根据所述第一语料的数量、所述第二语料的数量、所述第三语料的数量、所述第四语料的数量以及所述医疗语料的总数量,获取所述实体对的转移概率。10.根据权利要求3至5任一项所述的方法,其特征在于,所述通过所述至少两种概率模型分别对所述医疗实体进行处理,得到每种概率模型输出的概率结果,包括:若所述概率模型为基于互信息的概率模型,则针对每个实体对,获取所述医疗语料中同时出现症状类型与描述要素的第...

【专利技术属性】
技术研发人员:代小亚陈俊陆超黄海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1