【技术实现步骤摘要】
用于关系抽取的方法、装置、设备和介质
[0001]本公开的各实现方式涉及计算机领域,更具体地,涉及用于关系抽取的方法、装置、设备和计算机存储介质。
技术介绍
[0002]目前,文档级别的关系抽取方法备受关注。文档级别的关系抽取可以应用于问答、搜索等领域。通常,可以利用基于序列的模型或基于图的模型来考虑文档中更长的上下文和关系的长程依赖性。例如,可以通过池化操作来计算长程关系的表示,或者可以利用图中的节点来表示文档中距离较远的实体,从而更好地表征实体之间的长程关系。
[0003]然而,利用上述方法抽取出的长程关系的可解释性较差。因此,需要能够提供更好的可解释性的文档级别的关系抽取方法。
技术实现思路
[0004]在本公开的第一方面,提供了一种训练关系抽取模型的方法。该方法包括:基于由文档中的目标实体对和与所述目标实体对关联的目标关系组成的给定三元组,确定在给定三元组的条件下一组规则的概率分布,所述目标关系选自用于描述所述文档中的实体对之间联系的一组关系,所述一组规则用于描述所述目标实体对之间联系的逻辑;基于所述在给定三元组的条件下一组规则的概率分布,确定在给定三元组的条件下得分的概率分布,所述得分指示在所述文档中所述目标关系对于所述目标实体对是否有效;以及基于与所述得分对应的标记值,通过使所述在给定三元组的条件下得分的概率分布的参数的似然函数最大化,获得经训练的所述关系抽取模型。
[0005]在本公开的第二方面中,提供了一种用于训练关系抽取模型的装置。该装置包括:规则概率确定模块,被配置 ...
【技术保护点】
【技术特征摘要】
1.一种训练关系抽取模型的方法,包括:基于由文档中的目标实体对和与所述目标实体对关联的目标关系组成的给定三元组,确定在给定三元组的条件下一组规则的概率分布,所述目标关系选自用于描述所述文档中的实体对之间联系的一组关系,所述一组规则用于描述所述目标实体对之间联系的逻辑;基于所述在给定三元组的条件下一组规则的概率分布,确定在给定三元组的条件下得分的概率分布,所述得分指示在所述文档中所述目标关系对于所述目标实体对是否有效;以及基于与所述得分对应的标记值,通过使所述在给定三元组的条件下得分的概率分布的参数的似然函数最大化,获得经训练的所述关系抽取模型。2.根据权利要求1所述的方法,其中确定在给定三元组的条件下得分的概率分布包括:基于所述一组规则,确定在所述目标实体对之间的至少一个路径;基于所述至少一个路径途经的实体对以及关联的关系,确定所述在给定三元组和一组规则的条件下得分的概率分布;以及基于所述在给定三元组的条件下一组规则的概率分布以及所述在给定三元组和一组规则的条件下得分的概率分布,确定所述在给定三元组的条件下得分的概率分布。3.根据权利要求2所述的方法,其中使所述在给定三元组的条件下得分的概率分布的参数的似然函数最大化包括:基于所述参数的当前值,确定所述一组规则的后验概率分布;以及基于所述一组规则的后验概率分布,通过使所述似然函数最大化来确定所述参数的更新值。4.根据权利要求3所述的方法,其中确定所述一组规则的后验概率分布包括:基于所述在给定三元组的条件下一组规则的概率分布、所述至少一个路径途经的实体对以及所述关联的关系、以及所述标记值,确定针对所述一组规则中的每个规则的得分函数;基于针对每个规则的得分函数,确定每个规则的后验概率分布;以及基于所述每个规则的后验概率分布和所述一组规则中规则的数目,确定所述一组规则的近似后验概率分布,以作为所述一组规则的后验概率分布。5.根据权利要求4所述的方法,其中使所述似然函数最大化包括:使所述似然函数的下限最大化,所述似然函数的下限与所述一组规则的近似后验概率分布关联。6.根据权利要求5所述的方法,其中使所述似然函数的下限最大化包括:基于所述一组规则的近似后验概率分布,采样第一组更新规则;基于所述第一组更新规则,更新所述在给定三元组的条件下一组规则的概率分布;基于经更新的在给定三元组的条件下一组规则的概率分布,采样第二组更新规则;以及基于所述第二组更新规则,更新所述在给定三元组和一组规则的条件下得分的概率分布。7.根据权利要求1所述的方法,其中所述一组规则中的每个规则由所述一组关系中的多个关系的序列表示。
8.根据权利要求1所述的方法,其中使所述在给定三元组的条件下得分的概率分布的参数的似然函数最大化包括:利用期望最大化算法来对所述参数进行最大似然估计。9.一种用于关系抽取的方法,包括:基于由文档中的目标实体对和与所述目标实体对关联的目标关系组成的给定三元组,生成用于描述所述目标实体对之间联系的逻辑的一组规则,所述目标关系选自用于描述所述文档中的实体对之间联系的一组关系;基于所述一组规则,确定在所述目标实体对之间的至少一个路径;以及基于所述至少一个路径途经的实体对以及关联的关系,确定指示在所述文档中所述目标关系对于所述目标实体对是否有效的得分。10.根据权利要求9所述的方法,其中确定在所述目标实体对之间的至少一个路径包括:针对所述一组规则中的每个规则,确定对应的路径,所述路径开始于所述目标实体对中的起始实体并且结束于所述目标实体对中的末尾实体;并且所述路径途经的实体对之间联系的逻辑满足所述规则。11.根据权利要求9所述的方法,其中所述一组规则中的每个规则由所述一组关系中的多...
【专利技术属性】
技术研发人员:孙长志,茹栋宇,
申请(专利权)人:北京有竹居网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。