【技术实现步骤摘要】
医疗知识图谱的融合方法、装置、设备及介质
[0001]本申请涉及人工智能
,尤其是涉及到一种医疗知识图谱的融合方法、装置、设备及介质。
技术介绍
[0002]在构建医疗知识图谱的过程中,会遇到来自不同源的数据融合问题。一般情况下,针对仅在字符串上有差异的,如“腹泻”和“腹泻病”两个词条,可以通过编辑距离计算和一些规则来融合两个实体。但医疗实体通常是较短的实体文本,而且医疗实体的距离并不完全取决于其字符差异。如『脚气』和『脚气病』虽然是一字之差,但一个是足癣,一个是维生素缺乏,是完全不相同的疾病。或者像是“乙酰水杨酸”和“阿司匹林”,二者在字符串层级看起来毫无关系,但其实两个是同一物质。
[0003]随着图神经网络的发展,在其他领域已经有通过图神经网络模型进行实体融合的方法,但多是用节点去表示节点,只考虑节点之间的注意力,而并未考虑到医疗图谱领域中,属性(边)对实体的意义。用药品举例,A药品和B药品共用可能是增强,也有可能是降低效果的作用。因此现有的实体融合方法并不适用于医疗领域。
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种医疗知识图谱的实体融合方法,其特征在于,所述方法包括:获取第一医疗知识图谱,其中,所述第一医疗知识图谱包括多个第一节点以及第一边,所述第一边用于标识所述第一节点的关系属性;将所述第一医疗知识图谱输入多头注意力的神经网络模型,在所述神经网络模型中,分别根据每个所述第一节点相邻的第一邻接节点以及所述第一节点与所述第一邻接节点之间的第一邻接边更新所述第一医疗知识图谱;获取第二医疗知识图谱,其中,所述第二医疗知识图谱是预先利用所述神经网络模型更新过的医疗知识图谱,所述第二医疗知识图谱包括多个第二节点以及第二边,所述第二边用于标识所述第二节点的属性;在更新后的第一医疗知识图谱中确定待融合的第一目标节点,并根据所述第一目标节点与所述第二节点之间的相似度,将所述第一目标节点合入所述第二医疗知识图谱。2.根据权利要求1所述的方法,其特征在于,在所述将所述第一医疗知识图谱输入多头注意力的神经网络模型之前,所述方法还包括:对所述第二节点以及第二边进行初始化,得到第二节点向量以及第二边向量;依次将每个所述第二节点作为待更新节点,并利用所述待更新节点以及所述多头注意力的神经网络模型中的权重参数,确定所述待更新节点的第二注意力参数;对所述第二注意力参数进行归一化,得到所述待更新节点的第二归一化参数;根据第二邻接节点、所述权重参数以及所述第二归一化参数,更新所述待更新节点对应的第二节点向量,其中,所述第二邻接节点是与所述待更新节点相邻的第二节点;根据每个所述第二节点向量与其他第二节点向量之间的相似度设置损失函数,并根据所述损失函数调整所述权重参数,直至所述损失函数满足预设条件。3.根据权利要求2所述的方法,其特征在于,所述利用所述待更新节点以及所述多头注意力的神经网络模型中的权重参数,确定所述待更新节点的第二注意力参数,包括:在所述第二节点中确定与所述待更新节点相邻的第二邻接节点,并在所述第二边中确定所述待更新节点与所述第二邻接节点之间的第二邻接边;根据所述待更新节点、所述第二邻接边以及所述多头注意力的神经网络模型中每个注意力模块的权重参数,确定所述待更新节点与所述第二邻接节点之间的第二注意力参数,其中,所述第二注意力参数与所述注意力模块对应。4.根据权利要求2所述的方法,其特征在于,所述分别根据每个所述第一节点相邻的第一邻接节点以及所述第一节点与所述第一邻接节点之间的第一邻接边更新所述第一医疗知识图谱,包括:对所述第一节点以及所述第一边进行初始化,得到第一节点向量以及第一边向量;根据所述第一节点、所述第一邻接边以及所述权重参数,确定所述第一节点与所述第一相邻节点之间的第一注意力参数,并对所述第一注意力参数进行归一化,得到所...
【专利技术属性】
技术研发人员:梁欣,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。