一种实体关系的确定方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24253240 阅读:47 留言:0更新日期:2020-05-23 00:28
本申请公开了一种实体关系的确定方法、装置、电子设备及存储介质,所述方法包括:确定包含实体集的待预测文本,将待预测文本转换成字向量序列,待预测文本中的字与字向量序列中的字向量一一对应,基于待预测文本确定待预测文本的字相对于实体集中实体的首字和尾字的位置向量集,将位置向量集和字向量序列中的每个字向量进行拼接,得到特征向量,基于训练后的关系识别模型对特征向量进行关系识别,得到待预测文本中的实体集对应的关系信息,如此,可以提高各个领域信息中实体关系的确定效率。

A method, device, electronic equipment and storage medium for determining entity relationship

【技术实现步骤摘要】
一种实体关系的确定方法、装置、电子设备及存储介质
本申请涉及互联网
,尤其涉及一种实体关系的确定方法、装置、电子设备及存储介质。
技术介绍
随着信息化的大力推进,对于各个领域数据的结构化信息提取变得尤为重要,比如医疗领域,通信领域,音乐领域等等。举个例子,电子病历作为医疗领域中一种主要数据来源,从中提取出结构化信息是实现医疗信息化的一个重要途径,且有助于医疗知识图谱的构建与电子病历的二次研究使用。实体关系抽取作为电子病历结构化信息抽取的核心任务之一,其任务是从给定的电子病历文本中自动地识别出给定的实体对间存在怎样的语义关系。传统的电子病历实体关系抽取方法主要是基于规则的模板匹配法与基于特征的统计学习方法。其中,基于规则的方法首先根据相应领域的文本语料,人工总结归纳出相应的规则模板,然后通过模板匹配的方法进行实体关系抽取。而基于特征的统计学习方法则首先根据经验,人工提取出各种词法与句法特征,然后将特征转换为向量表示,最后通过计算特征向量之间的相似度来进行实体关系抽取。虽然这些方法在某些情况下可以取得较好的抽取结果,但严重依赖于手工制作的规则本文档来自技高网...

【技术保护点】
1.一种实体关系的确定方法,其特征在于,所述方法包括:/n确定包含实体集的待预测文本;/n将所述待预测文本转换成字向量序列;所述待预测文本中的字与所述字向量序列中的字向量一一对应;/n基于所述待预测文本确定所述待预测文本的字相对于所述实体集中实体的首字和尾字的位置向量集;/n将所述位置向量集和所述字向量序列中的每个字向量进行拼接,得到特征向量;/n基于训练后的关系识别模型对所述特征向量进行关系识别,得到所述待预测文本中的所述实体集对应的关系信息。/n

【技术特征摘要】
1.一种实体关系的确定方法,其特征在于,所述方法包括:
确定包含实体集的待预测文本;
将所述待预测文本转换成字向量序列;所述待预测文本中的字与所述字向量序列中的字向量一一对应;
基于所述待预测文本确定所述待预测文本的字相对于所述实体集中实体的首字和尾字的位置向量集;
将所述位置向量集和所述字向量序列中的每个字向量进行拼接,得到特征向量;
基于训练后的关系识别模型对所述特征向量进行关系识别,得到所述待预测文本中的所述实体集对应的关系信息。


2.根据权利要求1所述的方法,其特征在于,所述关系识别模型包括第一子模型、第二子模型和第三子模型;
所述第一子模型包括注意力机制层,所述第二子模型包括分段最大池化层,所述第三子模型包括全连接层;
所述第一子模型和所述第二子模型并联连接,且所述第一子模型的输出层和第二子模型的输出层分别与第三子模型的输入层连接。


3.根据权利要求2所述的方法,其特征在于,所述基于训练后的关系识别模型对所述特征向量进行关系识别,得到所述待预测文本中的所述实体集对应的关系信息,包括:
将所述特征向量输入所述第一子模型,得到带有注意力权重信息的第一特征向量;
将所述特征向量输入所述第二子模型,得到带有文本特征信息的第二特征向量;
将所述第一特征向量和所述第二特征向量输入所述第三子模型,利用所述第三子模型对所述第一特征向量和所述第二特征向量进行拼接,得到联合特征向量;
基于所述第三子模型的全连接层对所述联合特征向量进行识别,得到所述待预测文本中的所述实体集对应的关系信息。


4.根据权利要求1所述的方法,其特征在于,所述将所述待预测文本转换成字向量序列,包括:
根据预先构建的字典将所述待预测文本转换成字向量序列;
构建所述字典的步骤包括:
获取病历样本集;
确定病历样本集对应的字集以及所述字集中每个字的出现次数;
根据所述每个字的出现次数和预设的排列顺序对所述字集中的字进行排序,得到所述字典。


5.根据权利要求1所述的方法,其特征在于,所述确定包含实体集的待预测文本,包括:
获...

【专利技术属性】
技术研发人员:付天宇沈宏
申请(专利权)人:上海联影智能医疗科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1