知识图谱补全方法、系统、设备及存储介质技术方案

技术编号：40274985 阅读：9 留言：0更新日期：2024-02-02 23:01

本发明专利技术公开了知识图谱补全方法、系统、设备及存储介质，其中方法，包括：获取智能问答系统知识图谱中不完整三元组，所述不完整三元组包括：已知实体、待补全实体、以及已知实体与待补全实体之间的已知关系；将已知实体和已知关系输入到训练后的知识图谱补全模型中，输出待补全实体的预测值，进而实现智能问答系统知识图谱的补全；其中，训练后的知识图谱补全模型，用于对已知实体和已知关系进行编码处理和解码处理，得到待补全实体的预测值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及知识图谱补全，特别是涉及知识图谱补全方法、系统、设备及存储介质。

技术介绍

1、本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
，并不必然构成现有技术。

2、知识图谱是将现实世界中的概念、实体和相互关系用结构化形式表述出来。随着人工智能和大数据技术的发展，知识图谱因为其良好的搜索性能和较高的存储质量，称为了数据的主流存储方式，知识图谱往往采用三元组(实体，关系，实体)，来表示现实世界的事物，结构性好，直观性强。知识图谱作为结构化的显性知识，在语义表示、语义理解、语义推理和智能问答等计算任务重发挥着重要的作用。

3、虽然目前知识图谱中实体的数量可达数十亿的水平，但是大多数的知识图谱都是不完整的，这影响知识图谱的数据质量和整体结构性，导致知识图谱实际应用效果不佳，为了缓解这一技术问题，知识图谱补全称为研究热点，可以利用评分函数计算并对候选实体或关系进行排序，根据知识图谱中现有实体与关系推理出缺失的实体或关系。这一任务被称为知识图谱补全，也称为链接预测。

4、智能问答系统就是基于大量预料数据组成的知识图谱，通过编程语言实现的能够与人类进行对话、解决问题的软件系统，智能问答系统要求有较高的搜索精度，实现真正的所答即所问。

5、近年来，针对知识图谱补全任务提出了大量模型，已有的知识图谱补全技术可以大体分为trans结构、神经网络、张量分解和序列-序列等方法。trans模型在链接预测方面表现很好，并且参数少、操作简单，但trans方法在处理复杂关系方面，准确度较低，难以精准推算

6、为了更有效的进行预测，学者们将序列-序列模型作为一个可扩展的、通用的知识图谱嵌入模型。guo等人提出了一种深度序列模型，它通过扩展多层循环神经网络，将知识图谱建模成长度为3的序列，提出了3种不同策略来集成循环神经网络单元，并设计了两种新的知识图谱补全任务，分别称为关系预测和三元组预测，作为实体预测任务的补充。chen等人提出了一种序列-序列模型生成框架，它将知识图谱事实的表示统一为“平面”文本来处理不同的语言化图结构，而不考虑其原始形式。为了弥补“扁平”文本的知识图谱结构信息丢失，进一步改进了实体和关系的输入表示，以及模型中的推理算法。saxena等人将t5模型用于知识图谱补全的预训练，将知识图谱链接预测作为序列-序列的任务，与传统知识图谱嵌入模型相比，模型体积缩小了98％，并且可用于多个任务，有良好的通用性。

7、现有的知识图谱补全存在欠缺相似实体学习能力，导致智能问答过程中的搜索结果不够精准，可能会返回大量相似但是并非准确的内容，还需要搜索者进一步人工筛选，不能很好的实现所答即所问。

技术实现思路

1、为了解决现有技术的不足，本专利技术提供了知识图谱补全方法、系统、设备及存储介质；能够实现智能问答系统重问答结果的准确性和实时性。

2、一方面，提供了知识图谱补全方法，包括：

3、获取智能问答系统知识图谱中不完整三元组，所述不完整三元组包括：已知实体、待补全实体、以及已知实体与待补全实体之间的已知关系；

4、将已知实体和已知关系输入到训练后的知识图谱补全模型中，输出待补全实体的预测值，进而实现智能问答系统知识图谱的补全；

5、其中，训练后的知识图谱补全模型，用于对已知实体和已知关系进行编码处理和解码处理，得到待补全实体的预测值。

6、另一方面，提供了知识图谱补全系统，包括：

7、获取模块，其被配置为：获取智能问答系统知识图谱中不完整三元组，所述不完整三元组包括：已知实体、待补全实体、以及已知实体与待补全实体之间的已知关系；

8、补全模块，其被配置为：将已知实体和已知关系输入到训练后的知识图谱补全模型中，输出待补全实体的预测值，进而实现智能问答系统知识图谱的补全；

9、其中，训练后的知识图谱补全模型，用于对已知实体和已知关系进行编码处理和解码处理，得到待补全实体的预测值。

10、再一方面，还提供了一种电子设备，包括：

11、存储器，用于非暂时性存储计算机可读指令；以及

12、处理器，用于运行所述计算机可读指令，

13、其中，所述计算机可读指令被所述处理器运行时，执行上述第一方面所述的方法。

14、再一方面，还提供了一种存储介质，非暂时性存储计算机可读指令，其中，当非暂时性计算机可读指令由计算机执行时，执行第一方面所述方法的指令。

15、再一方面，还提供了一种计算机程序产品，包括计算机程序，所述计算机程序当在一个或多个处理器上运行的时候用于实现上述第一方面所述的方法。

16、上述技术方案具有如下优点或有益效果：

17、本专利技术提出了一种基于门控注意单元的序列-序列知识图谱补全方法，本专利技术的工作是在一个序列-序列知识图谱补全模型上扩展的，它利用了知识图谱的文本特性，模型尺寸较小。然而，为了达到良好的链接预测性能，它依赖于带有知识图谱嵌入模型的集成，使模型过于庞大且使用成本过高。本专利技术在该序列-序列模型中引入了门控注意单元gau(本专利技术的编码器)，将gau直接应用于模型的编码器结构，可以更好地捕捉序列中的上下文依赖关系，使预测结果更为准确，提高了训练速度和计算效率。

本文档来自技高网...

【技术保护点】

1.知识图谱补全方法，其特征是，包括：

2.如权利要求1所述的知识图谱补全方法，其特征是，所述训练后的知识图谱补全模型，包括：编码器和解码器；

3.如权利要求2所述的知识图谱补全方法，其特征是，所述解码器，包括：依次连接的第一解码模块、第二解码模块、第三解码模块、第四解码模块、第五解码模块和第六解码模块；

4.如权利要求3所述的知识图谱补全方法，其特征是，第六解码模块的输出端还与第五线性层的输入端连接，第五线性层的输出端与归一化层的输入端连接，归一化层的输出端输出标签的概率值；第一解码模块的输入端还与第二乘法器的输出端连接，第二乘法器的输入端用于输入标签的向量表示和位置编码；第四线性层的输出端与解码器的解码模块连接，是指第四线性层的输出端与解码器的每个层的第二多头注意力机制层的输入端连接。

5.如权利要求2所述的知识图谱补全方法，其特征是，所述编码器的工作过程为：

6.如权利要求3所述的知识图谱补全方法，其特征是，所述解码器的工作过程为：

7.如权利要求1所述的知识图谱补全方法，其特征是，所述训练后的知识图谱补全模型，训练过程包括：

8.知识图谱补全系统，其特征是，包括：

9.一种电子设备，其特征是，包括：

10.一种存储介质，其特征是，非暂时性存储计算机可读指令，其中，当非暂时性计算机可读指令由计算机执行时，执行权利要求1-7任一项所述方法的指令。

...

【技术特征摘要】

1.知识图谱补全方法，其特征是，包括：

2.如权利要求1所述的知识图谱补全方法，其特征是，所述训练后的知识图谱补全模型，包括：编码器和解码器；

4.如权利要求3所述的知识图谱补全方法，其特征是，第六解码模块的输出端还与第五线性层的输入端连接，第五线性层的输出端与归一化层的输入端连接，归一化层的输出端输出标签的概率值；第一解码模块的输入端还与第二乘法器的输出端连接，第二乘法器的输入端用于输入标签的向量表示和位置编码；第四线性层的输出端与...

【专利技术属性】
技术研发人员：姜雪松，衣凤阁，刘晓菁，丁浩润，张天鹏，
申请(专利权)人：齐鲁工业大学山东省科学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人