【技术实现步骤摘要】
知识图谱嵌入方法、装置、计算机设备和存储介质
[0001]本申请涉及人工智能
,特别是涉及一种知识图谱嵌入方法、装置、计算机设备和存储介质。
技术介绍
[0002]知识图谱中存储了一条知识,描述了现实世界中的一个事实。知识图谱中的知识一般以三元组的形式表示,如(头实体,关系,尾实体)和(实体,属性,值)。实体一般是现实世界中的事物名称、概念名称等等,关系则是对实体与实体之间联系的描述。知识图谱用节点来表示实体,用实体之间的边来表示实体之间的关系。
[0003]知识图谱嵌入是基于知识图谱的其它应用的重要基础,其目的主要是将构成知识图谱的实体、关系等信息进行向量表示,同时尽量保留它们在知识图谱中的原有特征。
[0004]目前的技术主要是通过约束头实体向量加上关系向量等于尾实体向量来进行实体、关系嵌入,但由于这种技术对知识图谱的处理过于简单而基本上只学习到了三元组的结构上的特征,导致其存在知识图谱嵌入效果较差的技术问题。
技术实现思路
[0005]基于此,有必要针对上述技术问题,提供一种知识图 ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱嵌入方法,其特征在于,所述方法包括:利用预先构建的基础特征提取模型获取知识图谱的实体结构特征和关系特征;所述实体结构特征至少包括头实体结构特征和尾实体结构特征;获取所述知识图谱的实体描述文本,利用预先构建的语义特征提取模型对所述实体描述文本进行处理得到实体语义特征;所述实体语义特征至少包括头实体语义特征和尾实体语义特征;利用所述头实体结构特征、尾实体结构特征、关系特征、实体语义特征和尾实体语义特征进行知识图谱嵌入。2.根据权利要求1所述的方法,其特征在于,所述利用预先构建的语义特征提取模型对所述实体描述文本进行处理得到实体语义特征,包括:将所述实体描述文本进行分词并进行词向量表示,得到所述实体描述文本对应的第一词向量序列;将所述第一词向量序列输入至所述语义特征提取模型,以使所述语义特征提取模型获取所述第一词向量序列包含的各实体向量分别与其他词向量的语义相关度,并根据所述语义相关度、各实体向量和其他词向量得到所述实体描述文本对应的第二词向量序列,根据所述第二词向量序列得到所述实体语义特征。3.根据权利要求2所述的方法,其特征在于,所述语义特征提取模型包括自注意模型和卷积神经网络;其中,所述自注意模型,用于获取所述第一词向量序列包含的各实体向量分别与其他词向量的语义相关度,并根据所述语义相关度、各实体向量和其他词向量得到所述实体描述文本对应的第二词向量序列;所述卷积神经网络,用于根据所述自注意模型得到的所述第二词向量序列获取所述实体语义特征。4.根据权利要求1所述的方法,其特征在于,所述基础特征提取模型为transD模型。5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:获取知识图谱样本;将所述知识图谱样本输入待训练的基础特征提取模型,以使所述待训练的基础特征提取模型输出头实体结构特征样本、头实体结构映射样本、尾实体结构特征样本、尾实体结构映射样本、关系特征样本和关系映射样本;利用基于所述头实体结构特征样本、头实体结构映射样本、尾实体结构特征样本、尾实体结构映射样本、关系特征样本和关系映射样本构建的目标函数,训...
【专利技术属性】
技术研发人员:曾璐琨,郑楷洪,龚起航,周尚礼,李胜,
申请(专利权)人:南方电网数字电网研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。