建立实体关系检测模型的方法以及装置制造方法及图纸

技术编号:24497976 阅读:30 留言:0更新日期:2020-06-13 03:48
本申请公开了一种建立实体关系检测模型的方法、装置、电子设备以及计算机可读存储介质,涉及医学实体检测技术领域。本申请在建立实体关系检测模型时所采用的实现方案为:获取医学文本数据;对所述医学文本数据进行结构化解析,得到与不同疾病对应的结构化语料;根据所述结构化语料获取训练样本,并构建所述训练样本中各医学实体对的融合特征;利用所述各医学实体对的融合特征训练分类模型,直至所述分类模型收敛,得到实体关系检测模型。本申请能够降低医学实体关系的检测成本,并提升医学实体关系的检测准确性。

The method and device of establishing entity relation detection model

【技术实现步骤摘要】
建立实体关系检测模型的方法以及装置
本申请涉及数据处理
,尤其涉及医学实体检测
中的一种建立实体关系检测模型的方法、装置、电子设备以及计算机可读存储介质。
技术介绍
近几年来,人工智能技术得到了越来越广泛的关注,作为其子领域的机器学习、深度学习等方法也被应用到各行各业当中。现在很多相关人士致力于人工智能医疗领域,研发出智能问诊、智能分导诊等互联网医疗领域的产品。而对于这些产品来说,一定需要较好的医学背景知识作为理论支撑,尤其是检测医学实体之间是否存在关系。但是,现有技术通常通过人工匹配的方式进行医学实体关键的检测,耗费较大人力和时间成本。
技术实现思路
本申请为解决技术问题所采用的技术方案是提供一种建立实体关系检测模型的方法、装置、电子设备以及计算机可读介质,所述方法包括:获取医学文本数据;对所述医学文本数据进行结构化解析,得到与不同疾病对应的结构化语料;根据所述结构化语料获取训练样本,并构建所述训练样本中各医学实体对的融合特征;利用所述各医学实体对的融合特征训练分类模型,直至所述分类模型收敛,得到实体关系检测模本文档来自技高网...

【技术保护点】
1.一种建立实体关系检测模型的方法,其特征在于,包括:/n获取医学文本数据;/n对所述医学文本数据进行结构化解析,得到与不同疾病对应的结构化语料;/n根据所述结构化语料获取训练样本,并构建所述训练样本中各医学实体对的融合特征;/n利用所述各医学实体对的融合特征训练分类模型,直至所述分类模型收敛,得到实体关系检测模型。/n

【技术特征摘要】
1.一种建立实体关系检测模型的方法,其特征在于,包括:
获取医学文本数据;
对所述医学文本数据进行结构化解析,得到与不同疾病对应的结构化语料;
根据所述结构化语料获取训练样本,并构建所述训练样本中各医学实体对的融合特征;
利用所述各医学实体对的融合特征训练分类模型,直至所述分类模型收敛,得到实体关系检测模型。


2.根据权利要求1所述的方法,其特征在于,所述与不同疾病对应的结构化语料包括:疾病、该疾病对应的标题以及各标题下所包含的段落内容。


3.根据权利要求1所述的方法,在得到与不同疾病对应的结构化语料之后,还包括:
对所述结构化语料进行自然语言理解处理,挖掘出对应不同医学类别的医学实体;
根据所述医学实体,构建对应不同医学类别的医学实体空间。


4.根据权利要求3所述的方法,其特征在于,所述根据所述结构化语料获取训练样本包括:
获取已知的医学实体关系对,作为正样本;
从对应疾病类别的医学实体空间中随机抽取疾病实体,并从其他医学类别的医学实体空间中随机抽取医学实体;
确定两个医学实体组成的医学实体对是否属于正样本,若否,则将该医学实体对作为负样本;
选取预设比例的正、负样本作为所述训练样本。


5.根据权利要求1所述的方法,其特征在于,所述构建所述训练样本中各医学实体对的融合特征包括:
根据所述结构化语料,提取医学实体对中各实体的字粒度特征、词粒度特征以及实体之间的句子粒度特征;
将各实体的字粒度特征输入机器学习模型,将输出结果与各实体的词粒度特征结合之后,再输入机器学习模型,将输出结果与句子粒度特征相结合,将结合结果作为各医学实体对的融合特征。


6.根据权利要求5所述的方法,其特征在于,在提取医学实体对中实体之间的句子粒度特征时,包括:
在所述结构化语料中检索医学实体对中与疾病对应的实体;
确定该实体所属段落内容的标题,获取对应该标题的预设权重;
将所述预设权重、实体之间的相似度以及实体之间的距离度量进行融合处理,将融合结果作为所述实体之间的句子粒度特征。


7.根据权利要求1所述的方法,其特征在于,所述利用各医学实体对的融合特征训练分类模型,直至所述分类模型收敛,包括:
将各医学实体对的融合特征作为分类模型的输入,获取分类模型针对各融合特征的输出结果;
根据各融合特征的输出结果与训练样本中各医学实体对的标注结果,确定分类模型的损失函数;
根据分类模型的损失函数调整分类模型的参数,直至分类模型的损失函数最小化,得到实体关系检测模型。


8.一种建立实体关系检测模型的装置,其特征在于,包括:
获取单元,用于获取医学文本数据;
解析单元,用于对所述医学文本数据进行结构化解析,得到与不同疾病对应的结构化语料;
构建单元,用于根据所述结构化语料获取训练样本,并构建所述训练样本中各医学实体对的融合特征;
训练单元,...

【专利技术属性】
技术研发人员:王春宇夏源施振辉黄海峰陆超
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1