当前位置: 首页 > 专利查询>之江实验室专利>正文

基于本地知识库与自然语言大模型的图查询方法与系统技术方案

技术编号:39307525 阅读:11 留言:0更新日期:2023-11-12 15:55
本申请涉及一种基于本地知识库与自然语言大模型的图查询方法与系统,其中,基于本地知识库与自然语言大模型的图查询方法包括:结合图数据库中获取的图谱结构与本地知识库文档,生成多个领域知识问题与图数据库查询命令的组合;将用户输入的问题转化为对应的向量,并确定与所述用户输入问题对应的向量相匹配的K个领域知识问题与图数据库查询命令的组合;将所述用户输入的问题与所述K个领域知识问题与图数据库查询命令的组合填充到预设的上下文提示模版,得到填充后的问题,并将填充后的问题输入至所述预训练自然语言大模型,生成最终的图数据库查询命令;使用所述最终的图数据库查询命令查询图数据库得到查询结果,提高了图查询结果的准确性。高了图查询结果的准确性。高了图查询结果的准确性。

【技术实现步骤摘要】
基于本地知识库与自然语言大模型的图查询方法与系统


[0001]本申请涉及计算机
,特别是涉及一种基于本地知识库与自然语言大模型的图查询方法与系统。

技术介绍

[0002]随着图数据库以及相关技术的不断发展与运用,图数据库填补了传统关系型数据无法高效查询多跳或间接关系的空白,在包括医疗、教育、安防、电商等不同领域带来了巨大的商业价值。同时,运用图数据库中的图计算算法能够对数据进行进一步分析与挖掘,指导业务分析与决策过程。然而,传统图数据库相关的应用要求操作用户对图结构数据需要具有基本的了解,才能进行高效的交互,增加了终端用户对图数据库相关的应用的使用门槛。
[0003]近来,自然语言大模型迎来了井喷式的发展,对比原有的自然语言模型,产生了更强的泛化与推理能力。大模型能大量的预训练语料知识,处理不同领域的多种不同任务,例如:翻译、信息抽取、阅读理解、代码生成。所以,运用自然语言大模型的生成代码的能力,用户以自然语言输入可以作为与图数据库新型的交互方式。但在垂直领域中,尤其是针对存在本地知识库且知识文档具有一定的保密要求的场景,没有利用本地知识库且没有构造有效的提示模版,导致自然语言大模型基于用户输入的自然语言问题获得的查询结果不准确,无法达到最优性能。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种基于本地知识库与自然语言大模型的图查询方法与系统。
[0005]第一方面,本申请实施例提供了一种基于本地知识库与自然语言大模型的图查询方法,所述方法包括:将图数据库中获取的图谱结构信息以及本地知识库文档的自然语言描述填充到预设提示模版中,获得填充后的自然语言序列;将所述填充后的自然语言序列输入至预训练自然语言大模型,生成多个领域知识问题与图数据库查询命令的组合;将所述组合中有效的领域知识问题输入至自然语言向量化模型,得到多个领域知识问题对应的向量;将用户输入的问题输入至所述自然语言向量化模型,得到用户输入问题对应的向量,并通过向量匹配模型或向量数据库匹配算子将所述用户输入问题对应的向量与所述多个领域知识问题对应的向量进行匹配,确定与所述用户输入问题对应的向量相匹配的K个领域知识问题与图数据库查询命令的组合;将所述用户输入的问题与所述K个领域知识问题与图数据库查询命令的组合填充到预设的上下文提示模版,得到填充后的问题,并将填充后的问题输入至所述预训练自然语言大模型,生成最终的图数据库查询命令;
使用所述最终的图数据库查询命令查询图数据库,得到查询结果。
[0006]在其中一个实施例中,所述图谱结构信息包括节点类型、边类型以及节点与边对应的所有属性。
[0007]在其中一个实施例中,所述预设提示模版包含所述图谱结构表示与所述本地知识库文档的语境信息以及匹配条件标识。
[0008]在其中一个实施例中,所述将所述组合中有效的领域知识问题输入至自然语言向量化模型,得到多个领域知识问题对应的向量包括:将所述组合中的图数据库查询命令进行预处理,得到预处理后的图数据库查询命令;使用图数据库校验所述预处理后的图数据库查询命令,确定所述组合中有效的图数据库查询命令;基于所述有效的图数据库查询命令,确定所述组合中对应的有效的领域知识问题;将所述组合中有效的领域知识问题输入至自然语言向量化模型,得到多个领域知识问题对应的向量。
[0009]在其中一个实施例中,所述组合中图数据库查询命令包含所述匹配条件标识;所述将所述组合中的图数据库查询命令进行预处理,得到预处理后的图数据库查询命令包括:使用正则表达式提取各所述图数据库查询命令中所述匹配条件标识所对应的节点或边及其属性;使用正则表达式提取所述节点或边对应的类型;在图数据库中随机抽取符合所述节点类型或边类型及其属性的数据,用所述数据替换各所述图数据库查询命令中的所述匹配条件标识,得到预处理后的图数据库查询命令。
[0010]在其中一个实施例中,所述使用图数据库校验所述预处理后的图数据库查询命令,确定所述组合中有效的图数据库查询命令包括:使用预处理后的图数据库查询命令调用图数据库,判断调用是否报错;若是,则对应的图数据库查询命令无效;若否,则对应的图数据库查询命令有效。
[0011]在其中一个实施例中,所述通过向量匹配模型或向量数据库匹配算子将所述用户输入问题对应的向量与所述多个领域知识问题对应的向量进行匹配,确定与所述用户输入问题对应的向量相匹配的K个领域知识问题与图数据库查询命令的组合包括:采用向量匹配模型或向量数据库匹配算子,将所述用户输入问题对应的向量与所述多个领域知识问题对应的向量进行匹配,确定与所述用户输入问题对应的向量相匹配的K个领域知识问题对应的向量;基于所述K个领域知识问题对应的向量,获得对应的K个领域知识问题与图数据库查询命令的组合。
[0012]第二方面,本申请实施例还提供了一种基于本地知识库与自然语言大模型的图查询系统,所述系统包括:
第一生成模块,用于将图数据库中获取的图谱结构信息以及本地知识库文档的自然语言描述填充到预设提示模版中,获得填充后的自然语言序列;将所述填充后的自然语言序列输入至预训练自然语言大模型,生成多个领域知识问题与图数据库查询命令的组合;获得模块,用于将所述组合中有效的领域知识问题输入至自然语言向量化模型,得到多个领域知识问题对应的向量;确定模块,用于将用户输入的问题输入至所述自然语言向量化模型,得到用户输入问题对应的向量,并通过向量匹配模型或向量数据库匹配算子将所述用户输入问题对应的向量与所述多个领域知识问题对应的向量进行匹配,确定与所述用户输入问题对应的向量相匹配的K个领域知识问题与图数据库查询命令的组合;第二生成模块,用于将所述用户输入的问题与所述K个领域知识问题与图数据库查询命令的组合填充到预设的上下文提示模版,得到填充后的问题,并将填充后的问题输入至所述预训练自然语言大模型,生成最终的图数据库查询命令;查询模块,用于使用所述最终的图数据库查询命令查询图数据库,得到查询结果。
[0013]第三方面,本申请实施例还提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行如上述第一方面所述的方法。
[0014]第四方面,本申请实施例还提供了一种计算机可读存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上述第一方面所述的方法。
[0015]上述基于本地知识库与自然语言大模型的图查询方法与系统,通过将图数据库中获取的图谱结构信息以及本地知识库文档的自然语言描述填充到预设提示模版中,获得填充后的自然语言序列;将所述填充后的自然语言序列输入至预训练自然语言大模型,生成多个领域知识问题与图数据库查询命令的组合;将所述组合中有效的领域知识问题输入至自然语言向量化模型,得到多个领域知识问题对应的向量;将用户输入的问题输入至所述自然语言向量化模型,得到用户输入问题对应的向量,并通过向量匹配模型或向量数据库匹配算子将所述用户输入问题对应的向量与所述多个领域知识问题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于本地知识库与自然语言大模型的图查询方法,其特征在于,所述方法包括:将图数据库中获取的图谱结构信息以及本地知识库文档的自然语言描述填充到预设提示模版中,获得填充后的自然语言序列;将所述填充后的自然语言序列输入至预训练自然语言大模型,生成多个领域知识问题与图数据库查询命令的组合;将所述组合中有效的领域知识问题输入至自然语言向量化模型,得到多个领域知识问题对应的向量;将用户输入的问题输入至所述自然语言向量化模型,得到用户输入问题对应的向量,并通过向量匹配模型或向量数据库匹配算子将所述用户输入问题对应的向量与所述多个领域知识问题对应的向量进行匹配,确定与所述用户输入问题对应的向量相匹配的K个领域知识问题与图数据库查询命令的组合;将所述用户输入的问题与所述K个领域知识问题与图数据库查询命令的组合填充到预设的上下文提示模版,得到填充后的问题,并将填充后的问题输入至所述预训练自然语言大模型,生成最终的图数据库查询命令;使用所述最终的图数据库查询命令查询图数据库,得到查询结果。2.根据权利要求1所述的基于本地知识库与自然语言大模型的图查询方法,其特征在于,所述图谱结构信息包括节点类型、边类型以及节点与边对应的所有属性。3.根据权利要求1所述的基于本地知识库与自然语言大模型的图查询方法,其特征在于,所述预设提示模版包含所述图谱结构表示与所述本地知识库文档的语境信息以及匹配条件标识。4.根据权利要求3所述的基于本地知识库与自然语言大模型的图查询方法,其特征在于,所述将所述组合中有效的领域知识问题输入至自然语言向量化模型,得到多个领域知识问题对应的向量包括:将所述组合中的图数据库查询命令进行预处理,得到预处理后的图数据库查询命令;使用图数据库校验所述预处理后的图数据库查询命令,确定所述组合中有效的图数据库查询命令;基于所述有效的图数据库查询命令,确定所述组合中对应的有效的领域知识问题;将所述组合中有效的领域知识问题输入至自然语言向量化模型,得到多个领域知识问题对应的向量。5.根据权利要求4所述的基于本地知识库与自然语言大模型的图查询方法,其特征在于,所述组合中图数据库查询命令包含所述匹配条件标识;所述将所述组合中的图数据库查询命令进行预处理,得到预处理后的图数据库查询命令包括:使用正则表达式提取各所述图数据库查询命令中所述匹配条件标识所对应的节点或边及其属性;使用正则表达式提取所述节点或边对应的类型;在图数据库中随机抽取符合所述节点类型或边类型及其属性的数据,用所述数据替换各所述图数据库查询命令中的所述匹配条件标识,得到预处理后...

【专利技术属性】
技术研发人员:胡汉一付村吴迪那崇宁
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1