基于知识图谱的检索增强方法、装置、设备及介质制造方法及图纸

技术编号：40602700 阅读：6 留言：0更新日期：2024-03-12 22:07

本申请实施例提供一种基于知识图谱的检索增强方法、装置、设备及介质，该方法包括：获取待查询问题；根据待查询问题和预先训练的知识图谱增强模型，确定与待查询问题的初始查询结果；根据待查询问题、初始查询结果和预先训练的大语言模型生成目标答案，不仅节省了模型重新训练的时间，而且还提高了回答问题的准确性和效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理，具体而言，涉及一种基于知识图谱的检索增强方法、装置、设备及介质。

技术介绍

1、随着网络技术的不断发展，在自然语言建模下，出现了大型语言模型(largelanguage model,llm)，例如chatgpt模型，该模型可以应用的诸多领域中，例如知识问答。

2、但是由于大型语言模型的黑盒特性，内在机理尚不清晰，容易产生幻觉，导致大型语言模型输出内容的不准确。若有新的知识出现，为了提高回答准确性，则需要对大型语言模型进行微调。微调过程需要消耗大量的计算资源，且时间较长，导致后续的知识问答也需要较长时间才能实现，如何能减少模型知识更新的时间，且提高知识问答的效率和准确率，是目前急需解决的问题。

技术实现思路

1、本申请的一些实施例的目的在于提供一种基于知识图谱的检索增强方法、装置、设备及介质，通过本申请的实施例的技术方案，通过获取待查询问题；根据所述待查询问题和预先训练的知识图谱增强模型，确定与所述待查询问题的初始查询结果，其中，所述知识图谱增强模型用于查找与所述待查询问题相似度大于第一预设值的查询结果；根据所述待查询问题、所述初始查询结果，预先训练的大语言模型生成目标答案，本申请实施例通过以知识图谱作为大模型的外部知识库，将用户输入的待查询问题在知识图谱增强模型中进行检索后，得到初始查询结果，并将待查询问题与初始查询结果共同输入至大语言模型中，得到目标答案，不仅节省了模型重新训练的时间，而且还提高回答问题的准确性和效率。

2、第一方面，本

3、根据所述待查询问题和预先训练的知识图谱增强模型，确定与所述待查询问题的初始查询结果，其中，所述知识图谱增强模型用于查找与所述待查询问题相似度大于第一预设值的查询结果；

4、根据所述待查询问题、所述初始查询结果和预先训练的大语言模型，生成目标答案。

5、本申请的一些实施例通过以知识图谱作为大模型的外部知识库，将用户输入的待查询问题在知识图谱增强模型中进行检索后，得到初始查询结果，并将待查询问题与初始查询结果共同输入至大语言模型中，得到目标答案，不仅节省了模型重新训练的时间，而且还提高回答问题的准确性和效率。

6、可选地，所述预先训练的知识图谱增强模型通过如下方式获得：

7、获取样本查询问题；

8、采用roberta模型，根据所述样本查询问题，确定与所述样本查询问题中各个词对应的词样本向量；

9、根据所述词样本向量，确定所述样本查询问题中的关系类型，并确定与所述关系类型对应的第一损失函数；

10、根据所述词样本向量，确定所述样本查询问题中的实体信息，并确定与所述实体信息对应的第二损失函数；

11、根据所述实体信息和所述关系类型，确定与所述样本查询问题对应的三元组信息；

12、根据所述三元组信息、所述样本查询问题和双向长短期记忆网络模型，确定第一特征向量和第二特征向量；

13、根据所述第一特征向量和所述第二特征向量，确定第三损失函数；

14、根据所述第一损失函数、所述第二损失函数和所述第三损失函数，确定第四损失函数；

15、在所述第四损失函数收敛的情况下，确定与所述第四损失函数对应的知识图谱增强模型。

16、本申请的一些实施例通过将实体预测和关系预测两个任务联合学习，可以同时预测用户输入问题中包含的实体和关系，避免误差传播，采用孪生网络架构计算用户输入问题和知识图谱中三元组的语义相似性，提高模型效率和泛化能力。

17、可选地，所述根据所述第一损失函数、所述第二损失函数和所述第三损失函数，确定第四损失函数，包括：

18、获取第一损失函数的第一权重值、第二损失函数的第二权重值和第三损失函数的第三权重值；

19、分别计算所述第一损失函数和所述第一权重值的第一乘积、所述第二损失函数和所述第二权重值的第二乘积以及第三损失函数和第三权重值的第三乘积；

20、根据所述第一乘积、所述第二乘积和所述第三乘积的和，确定所述第四损失函数。

21、本申请的一些实施例计算第一损失函数、所述第二损失函数和所述第三损失函数，并根据各自对应的权重，计算第四损失函数，在此过程中，采用孪生网络架构计算用户输入问题和知识图谱中三元组的语义相似性，提高模型效率和泛化能力。

22、可选地，所述根据所述词样本向量，确定所述样本查询问题中的关系类型，并确定与所述关系类型对应的第一损失函数，包括：

23、对所述词样本向量进行平均池化处理，得到与所述样本查询问题对应的句向量；

24、对所述句向量进行全接连网络模型处理后，得到处理后向量；

25、采用sigmoid函数，对所述处理后向量进行处理，得到关系概率；

26、在所述关系概率大于第三预设值的情况下，将与所述关系概率对应的关系类型，确定为所述样本查询问题中的关系类型；

27、根据所述关系概率，计算与所述关系类型对应的第一损失函数。

28、本申请的一些实施例，采用联合学习的方式，共同训练实体预测和关系预测模块，能够同时预测用户输入问题中的实体和关系，并在知识图谱中搜索相似的三元组，并计算第一损失函数，准确高效地引入与问题相关的知识，避免误差传播问题。

29、可选地，所述根据所述词样本向量，确定所述样本查询问题中的实体信息，并确定与所述实体信息对应的第二损失函数，包括：

30、采用双向长短期记忆网络模型对所述词样本向量进行双向建模，并通过softmax函数，得到所述样本查询问题中的每个词对应的标签；

31、根据所述每个词对应的标签，确定与所述实体信息对应的第二损失函数。

32、本申请的一些实施例通过采用联合学习的方式，共同训练实体预测和关系预测模块，能够同时预测用户输入问题中的实体和关系，并在知识图谱中搜索相似的三元组，并计算实体信息对应的第二损失函数，准确高效地引入与问题相关的知识，避免误差传播问题。

33、可选地，所述根据所述实体信息和所述关系类型，确定与所述样本查询问题对应的三元组信息，包括：

34、根据所述实体信息和所述关系类型，在知识图谱中进行查找，确定与所述实体信息和所述关系类型对应的三元组信息。

35、可选地，所述根据所述三元组信息、所述样本查询问题和双向长短期记忆网络模型，确定第一特征向量和第二特征向量，包括：

36、采用所述双向长短期记忆网络模型对所述三元组信息进行编码，得到与所述三元组信息对应的第一特征向量；

37、采用所述双向长短期记忆网络模型对所述样本查询问题进行编码，确定与所述样本查询问题对应的第二特征向量。

38、本申请的一些实施例通过采用双向长短期记忆网络模型分别对三元组信息、所述样本查询问题进行编码，采用本文档来自技高网...

【技术保护点】

1.一种基于知识图谱的检索增强方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于知识图谱的检索增强方法，其特征在于，所述预先训练的知识图谱增强模型通过如下方式获得：

3.根据权利要求2所述的基于知识图谱的检索增强方法，其特征在于，所述根据所述第一损失函数、所述第二损失函数和所述第三损失函数，确定第四损失函数，包括：

4.根据权利要求2所述的基于知识图谱的检索增强方法，其特征在于，所述根据所述词样本向量，确定所述样本查询问题中的关系类型，并确定与所述关系类型对应的第一损失函数，包括：

5.根据权利要求4所述的基于知识图谱的检索增强方法，其特征在于，所述根据所述词样本向量，确定所述样本查询问题中的实体信息，并确定与所述实体信息对应的第二损失函数，包括：

6.根据权利要求5所述的基于知识图谱的检索增强方法，其特征在于，所述根据所述实体信息和所述关系类型，确定与所述样本查询问题对应的三元组信息，包括：

7.根据权利要求6所述的基于知识图谱的检索增强方法，其特征在于，所述根据所述三元组信息、所述样本查询问题

8.一种基于知识图谱的检索增强装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中，所述处理器执行所述程序时可实现权利要求1-7中任意一项权利要求所述的基于知识图谱的检索增强方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述程序被处理器执行时可实现权利要求1-7中任意一项权利要求所述的基于知识图谱的检索增强方法。

...

【技术特征摘要】

1.一种基于知识图谱的检索增强方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于知识图谱的检索增强方法，其特征在于，所述预先训练的知识图谱增强模型通过如下方式获得：

6.根据权利要求5所述的基于知识图谱的检索增强方法...

【专利技术属性】
技术研发人员：李娇，
申请(专利权)人：北京天融信网络安全技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人