知识图谱嵌入表示方法及装置制造方法及图纸

技术编号:35030968 阅读:19 留言:0更新日期:2022-09-24 23:05
本公开涉及人工智能技术领域,提供了一种知识图谱嵌入表示方法及装置。该方法包括:定义知识图谱嵌入表示,并基于知识图谱嵌入表示中实体的名称获取第一文档;利用预设算法初始化知识图谱嵌入表示,得到第一表示和第二表示;利用语言表征模型初始化第一文档,得到第二文档;根据第一表示和第二表示,计算第三表示;根据第一表示和第二文档,计算第四表示;根据第三表示和第四表示,计算第五表示,根据第二表示和第四表示,计算第六表示;根据第五表示和第六表示计算损失值,并基于损失值训练知识图谱嵌入模型;利用知识图谱嵌入模型提供知识图谱嵌入服务。识图谱嵌入服务。识图谱嵌入服务。

【技术实现步骤摘要】
知识图谱嵌入表示方法及装置


[0001]本公开涉及人工智能
,尤其涉及一种知识图谱嵌入表示方法及装 置。

技术介绍

[0002]知识图谱嵌入(Knowledge Graph Embedding,KGE)是一种学习知识库中的 实体和关系的Embedding表示的方法,是语义检索、知识问答、推荐等众多应 用的基础研究。现有技术,常常通过文本增强来改进知识图谱嵌入表示的方法。 具体地,通常采用实体连接工具将知识图谱中的实体连接到文档库中的单词, 然后构建实体和文档库中单词的共现网络,通过skip

gram等方法增强知识图谱 实体和关系的语义信息。这种方法存在如下问题:当前的实体连接工具不够准 确,存在错误传导到下游任务的问题;使用语义共现网络进行嵌入表示学习忽 略了文档的语义信息。上述存在的问题都会导致最终知识图谱嵌入表示的准确 度较低的问题。
[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下技术问 题:现有的知识图谱嵌入表示的方法存在准确度较低的问题。

技术实现思路

[0004]有鉴于此,本公开实施例提供了一种知识图谱嵌入表示方法及装置,以解 决现有技术中,现有的知识图谱嵌入表示的方法存在准确度较低的问题。
[0005]本公开实施例的第一方面,提供了一种知识图谱嵌入表示方法,包括:定 义知识图谱嵌入表示,并基于知识图谱嵌入表示中实体的名称获取第一文档; 利用预设算法初始化知识图谱嵌入表示,得到第一表示和第二表示;利用语言 表征模型初始化第一文档,得到第二文档;根据第一表示和第二表示,计算第 三表示;根据第一表示和第二文档,计算第四表示;根据第三表示和第四表示, 计算第五表示,根据第二表示和第四表示,计算第六表示;根据第五表示和第 六表示计算损失值,并基于损失值训练知识图谱嵌入模型;利用知识图谱嵌入 模型提供知识图谱嵌入服务。
[0006]本公开实施例的第二方面,提供了一种知识图谱嵌入表示装置,包括:定 义模块,被配置为定义知识图谱嵌入表示,并基于知识图谱嵌入表示中实体的 名称获取第一文档;第一初始化模块,被配置为利用预设算法初始化知识图谱 嵌入表示,得到第一表示和第二表示;第二初始化模块,被配置为利用语言表 征模型初始化第一文档,得到第二文档;第一计算模块,被配置为根据第一表 示和第二表示,计算第三表示;第二计算模块,被配置为根据第一表示和第二 文档,计算第四表示;第三计算模块,被配置为根据第三表示和第四表示,计 算第五表示,根据第二表示和第四表示,计算第六表示;第四计算模块,被配 置为根据第五表示和第六表示计算损失值,并基于损失值训练知识图谱嵌入模 型;服务模块,被配置为利用知识图谱嵌入模型提供知识图谱嵌入服务。
[0007]本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以 及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机 程序时实现上述
方法的步骤。
[0008]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可 读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的 步骤。
[0009]本公开实施例与现有技术相比存在的有益效果是:因为本公开实施例定义 知识图谱嵌入表示,并基于知识图谱嵌入表示中实体的名称获取第一文档;利 用预设算法初始化知识图谱嵌入表示,得到第一表示和第二表示;利用语言表 征模型初始化第一文档,得到第二文档;根据第一表示和第二表示,计算第三 表示;根据第一表示和第二文档,计算第四表示;根据第三表示和第四表示, 计算第五表示,根据第二表示和第四表示,计算第六表示;根据第五表示和第 六表示计算损失值,并基于损失值训练知识图谱嵌入模型;利用知识图谱嵌入 模型提供知识图谱嵌入服务,因此,采用上述技术手段,可以解决现有技术中, 因为没有充分利用用户会话记录中的信息,进而给用户推荐物品存在效率低的 问题,进而提高推荐物品的效率。
附图说明
[0010]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技 术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅 仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳 动的前提下,还可以根据这些附图获得其它的附图。
[0011]图1是本公开实施例的应用场景的场景示意图;
[0012]图2是本公开实施例提供的一种知识图谱嵌入表示方法的流程示意图;
[0013]图3是本公开实施例提供的一种知识图谱嵌入表示装置的结构示意图;
[0014]图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0015]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术 之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当 清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中, 省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节 妨碍本公开的描述。
[0016]下面将结合附图详细说明根据本公开实施例的一种知识图谱嵌入表示方法 和装置。
[0017]图1是本公开实施例的应用场景的场景示意图。该应用场景可以包括终端 设备101、102和103、服务器104以及网络105。
[0018]终端设备101、102和103可以是硬件,也可以是软件。当终端设备101、 102和103为硬件时,其可以是具有显示屏且支持与服务器104通信的各种电 子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机 等;当终端设备101、102和103为软件时,其可以安装在如上的电子设备中。 终端设备101、102和103可以实现为多个软件或软件模块,也可以实现为单个 软件或软件模块,本公开实施例对此不作限制。进一步地,终端设备101、102 和103上可以安装有各种应用,例如数据处理应用、即时通信工具、社交平台 软件、搜索类应用、购物类应用等。
[0019]服务器104可以是提供各种服务的服务器,例如,对与其建立通信连接的 终端设备发送的请求进行接收的后台服务器,该后台服务器可以对终端设备发 送的请求进行接收和分析等处理,并生成处理结果。服务器104可以是一台服 务器,也可以是由若干台服务器组成的服务器集群,或者还可以是一个云计算 服务中心,本公开实施例对此不作限制。
[0020]需要说明的是,服务器104可以是硬件,也可以是软件。当服务器104为 硬件时,其可以是为终端设备101、102和103提供各种服务的各种电子设备。 当服务器104为软件时,其可以是为终端设备101、102和103提供各种服务的 多个软件或软件模块,也可以是为终端设备101、102和103提供各种服务的单 个软件或软件模块,本公开实施例对此不作限制。
[0021]网络105可以是采用同轴电缆、双绞线和光纤连接的有线网络,也可以是 无需布线就能实现各种通信设备本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱嵌入表示方法,其特征在于,包括:定义知识图谱嵌入表示,并基于所述知识图谱嵌入表示中实体的名称获取第一文档;利用预设算法初始化所述知识图谱嵌入表示,得到第一表示和第二表示;利用语言表征模型初始化所述第一文档,得到第二文档;根据所述第一表示和所述第二表示,计算第三表示;根据所述第一表示和所述第二文档,计算第四表示;根据所述第三表示和所述第四表示,计算第五表示,根据所述第二表示和所述第四表示,计算第六表示;根据所述第五表示和所述第六表示计算损失值,并基于所述损失值训练知识图谱嵌入模型;利用所述知识图谱嵌入模型提供知识图谱嵌入服务。2.根据权利要求1所述的方法,其特征在于,所述利用语言表征模型初始化所述第一文档,得到第二文档,包括:对所述第一文档中的实体进行标注处理;利用所述语言表征模型初始化经过所述标注处理后的第一文档,得到所述第二文档。3.根据权利要求1所述的方法,其特征在于,所述根据所述第一表示和所述第二表示,计算第三表示,包括:计算所述第一表示的转置矩阵;基于所述第一表示、所述转置矩阵、所述第二表示、第一权重矩阵、第二权重矩阵和第一预设偏差,利用双曲正切函数进行计算,得到第一计算结果;基于所述第一计算结果和第三权重矩阵进行计算,得到第二计算结果;基于所述第二计算结果确定第一注意力权重;基于所述第一注意力权重、所述第一表示和和第四权重矩阵进行计算,得到所述第三表示。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一表示和所述第二文档,计算第四表示,包括:基于所述第一表示、所述第二文档和第二预设偏差,利用双曲正切函数进行计算,得到第三计算结果;基于所述第三计算结果和第五权重矩阵进行计算,得到第四计算结果;基于所述第四计算结果确定第二注意力权重;基于所述第二注意力权重、所述第一表示、所述第二文档和第六权重矩阵进行计算,得到第七表示;将所述第七表示输入所述语言表征模型,输出所述第四表示。5.根据权利要求1所述的方法,其特征在于,所述根据所述第三表示和所述第四表示,计算第五表示,根据所述第二表示和所述第四表示,计算第六表示,包括:根据第四权重矩阵、所述第三表示、所述第四表示和第二注意力权重,计算所述第五表示;基于第七权重矩阵、所述第二表示、所述第四表示和第三预设偏差,利用...

【专利技术属性】
技术研发人员:曾山松
申请(专利权)人:深圳集智数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1