文本的知识表示方法、装置、设备及计算机可读介质制造方法及图纸

技术编号:33245849 阅读:37 留言:0更新日期:2022-04-27 17:57
本申请涉及一种文本的知识表示方法、装置、设备及计算机可读介质。该方法包括:在目标文本中确定目标实体,其中,目标实体为目标文本中待知识表示的实体;在目标文本中将目标实体遮盖后,将目标文本转换为特征向量;将特征向量输入语言表征模型,以利用语言表征模型确定遮盖后的目标实体的第一表征向量;在知识图谱中获取与目标实体相连的其他实体所在的目标三元组,并基于第一表征向量和目标三元组对目标实体进行知识表示。本申请通过所有与目标实体的连接的其他实体和关系来学习该目标实体的知识表示,解决了知识表示的实体信息不完整的技术问题。整的技术问题。整的技术问题。

【技术实现步骤摘要】
文本的知识表示方法、装置、设备及计算机可读介质


[0001]本申请涉及知识图谱
,尤其涉及一种文本的知识表示方法、装置、设备及计算机可读介质。

技术介绍

[0002]知识图谱中一个实体在图谱中往往与多个实体相连,之间的关系也是复杂的,而且实体在文本中上下文信息也是针对实体重要的描述信息。然而在知识图谱的知识表示学习中,往往知识表示的结果忽略了很多实体的重要信息,即相关技术中知识表示的实体信息不完整,因为绝大多数方法都是将知识图谱中实体和关系映射到低维的连续向量空间中,数据的稀疏性导致信息的不足,进一步导致实体和关系语义表示的不完整性。
[0003]针对知识表示的实体信息不完整的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请提供了一种文本的知识表示方法、装置、设备及计算机可读介质,以解决知识表示的实体信息不完整的技术问题。
[0005]根据本申请实施例的一个方面,本申请提供了一种文本的知识表示方法,包括:
[0006]在目标文本中确定目标实体,其中,目标实体为目标文本中待知识表示本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本的知识表示方法,其特征在于,包括:在目标文本中确定目标实体,其中,所述目标实体为所述目标文本中待知识表示的实体;在所述目标文本中将所述目标实体遮盖后,将所述目标文本转换为特征向量;将所述特征向量输入语言表征模型,以利用所述语言表征模型确定遮盖后的所述目标实体的第一表征向量;在知识图谱中获取与所述目标实体相连的其他实体所在的目标三元组,并基于所述第一表征向量和所述目标三元组对所述目标实体进行知识表示。2.根据权利要求1所述的方法,其特征在于,在知识图谱中获取与所述目标实体相连的其他实体所在的目标三元组包括:获取所述目标实体的标注数据,其中,所述标注数据为按照所述目标实体的实体关联关系预先在所述知识图谱中标注的实体关联数据;按照所述标注数据在所述知识图谱中确定所述目标实体以及与所述目标实体连接的其他实体;将所述目标实体原有的第二表征向量、所述目标实体与所述其他实体之间的关系向量以及所述其他实体的第三表征向量按照所述目标实体与所述其他实体之间的链指关系放入三元组中,得到所述目标三元组。3.根据权利要求2所述的方法,其特征在于,将所述目标实体原有的第二表征向量、所述目标实体与所述其他实体之间的关系向量以及所述其他实体的第三表征向量按照所述目标实体与所述其他实体之间的链指关系放入三元组中,得到所述目标三元组包括:按照所述链指关系在所述目标实体和所述其他实体中确定头实体和尾实体;将所述头实体对应的表征向量填入所述三元组中的头元素位置,将所述尾实体对应的表征向量填入所述三元组中的尾元素位置,将所述关系向量填入所述三元组中的中间元素位置,得到所述目标三元组。4.根据权利要求3所述的方法,其特征在于,基于所述第一表征向量和所述目标三元组对所述目标实体进行知识表示包括:利用所述目标三元组确定所述目标实体的知识表示向量集合;将所述第一表征向量和所述知识表示向量集合输入全连接层,得到所述全连接层预测输出的所述目标实体的知识表示。5.根据权利要求4所述的方法,其特征在于,利用所述目标三元组确定所述目标实体的知...

【专利技术属性】
技术研发人员:刘伟硕于皓吴信东吴明辉张杰
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1