一种图数据语义检索方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38904118 阅读:8 留言:0更新日期:2023-09-22 14:22
本公开涉及一种图数据语义检索方法、装置、电子设备及存储介质。所述图数据语义检索方法包括:接收用户输入的用户问题,在多个子图模式中,确定与用户问题最相匹配的子图模式,其中多个子图模式为对图模式分解得到;将用户问题与最相匹配的子图模式输入大语言模型,确定与用户问题对应的图查询语句;根据图查询语句搜索图数据库,确定目标图数据。本公开实施例通过确定与用户问题最相匹配的子图模式,将用户问题与最相匹配的子图模式输入大语言模型,准确地过滤了无关信息,约简了输入空间,高效生成了准确的图查询语句,提高了检索结果的准确性和答复信息的完整性。索结果的准确性和答复信息的完整性。索结果的准确性和答复信息的完整性。

【技术实现步骤摘要】
一种图数据语义检索方法、装置、电子设备及存储介质


[0001]本公开涉及图数据处理领域,尤其涉及一种图数据语义检索方法、装置、电子设备及存储介质。

技术介绍

[0002]随着大语言模型(large language model,LLM)的出现,已有部分业界人员借助LLM对图数据库中的图数据进行语义检索和问答,例如在输入自然语言的问题描述后使用LLM将其转换为数据库查询语言,从而进一步在图数据库中完成查询,输出查询的图数据。
[0003]由于LLM中没有图数据的模式信息,在相关技术中,通常是将图数据的模式信息和用户的问题同时输入给大语言模型。但是企业的图数据以及对应的图模式通常体量庞大,图数据存在节点数量多、节点属性信息多、关系数量多等性质,LLM无法接受如此庞大的上下文信息量,使得业界人员无法高效地利用LLM生成准确、完整的图查询语句,进而对图数据进行语义检索和问答。现有的解决LLM对输入文本长度限制的方法为将文本分割为短文本,然后基于关键词将短文本与用户问题进行匹配,最后将匹配成功的短文本与用户问题输入大语言模型,但该方法在根据图模式和用户问题生成图查询语句的场景下无法使用。
[0004]如何对基于LLM的图数据语义检索过程进行调整和优化,约简输入空间,高效生成准确的图查询语句,提高检索结果的准确性,是目前亟待解决的问题。

技术实现思路

[0005]有鉴于此,本公开提出了一种图数据语义检索方法、装置、电子设备及存储介质。
[0006]根据本公开的一方面,提供了一种图数据语义检索方法,包括:
[0007]接收用户输入的用户问题,在多个子图模式中,确定与用户问题最相匹配的子图模式,所述多个子图模式为对图模式分解得到的;
[0008]将所述用户问题与所述最相匹配的子图模式输入大语言模型,确定与所述用户问题对应的图查询语句;
[0009]根据所述图查询语句搜索图数据库,确定目标图数据。
[0010]在一种可能的实现方式中,接收用户输入的用户问题前,所述方法还包括:
[0011]根据业务的问答场景,将图模式分解为多个子图模式;其中,所述多个子图模式能够涵盖全部的业务问答场景。
[0012]在一种可能的实现方式中,所述在多个子图模式中,确定与用户问题最相匹配的子图模式,包括:
[0013]将所述用户问题转换为问题向量;
[0014]计算所述问题向量和多个描述向量的相似度,所述多个描述向量用于分别描述各子图模式能够解决的用户问题类型;
[0015]根据相似度最大的描述向量,确定与用户问题最相匹配的子图模式。
[0016]在一种可能的实现方式中,在将所述用户问题转换为问题向量之前,所述方法还
包括:
[0017]将所述多个子图模式通过大语言模型进行自然语言重构,确定多个子图模式描述;
[0018]将所述多个子图模式描述转换为多个描述向量。
[0019]在一种可能的实现方式中,确定目标图数据后,所述方法还包括:
[0020]将所述目标图数据通过大语言模型进行自然语言重构,确定用户问题答案;
[0021]将所述用户问题答案输出至用户前端。
[0022]根据本公开的另一方面,提供了一种图数据语义检索装置,包括:
[0023]匹配模块,用于接收用户输入的问题,在多个子图模式中,确定与用户问题最相匹配的子图模式,所述多个子图模式为对图模式分解得到的;
[0024]输入模块,用于将所述用户问题与所述最相匹配的子图模式输入大语言模型,确定与所述用户问题对应的图查询语句;
[0025]确定模块,用于根据所述图查询语句搜索图数据库,确定目标图数据。
[0026]在一种可能的实现方式中,所述装置还包括:
[0027]分解模块,用于在接收用户输入的用户问题前,根据业务的问答场景,将图模式分解为多个子图模式;
[0028]其中,所述多个子图模式能够涵盖全部的业务问答场景。
[0029]在一种可能的实现方式中,所述匹配模块包括:
[0030]子图模式描述单元,用于将所述多个子图模式通过大语言模型进行自然语言重构,确定多个子图模式描述;
[0031]描述向量转换单元,用于将所述多个子图模式描述转换为多个描述向量;
[0032]问题向量转换单元,用于将所述用户问题转换为问题向量;
[0033]相似度计算单元,用于计算所述问题向量和多个描述向量的相似度,所述多个描述向量用于分别描述各子图模式能够解决的用户问题类型;
[0034]确定单元,用于根据相似度最大的描述向量,确定与用户问题最相匹配的子图模式。
[0035]在一种可能的实现方式中,所述装置还包括:
[0036]重构模块,用于在确定目标数据后,将所述目标图数据通过大语言模型进行自然语言重构,确定用户问题答案;
[0037]输出模块,用于将所述用户问题答案输出至用户前端。
[0038]根据本公开的另一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为在执行所述存储器存储的指令时,实现上述方法。
[0039]根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。
[0040]在本公开实施例中,首先接收用户输入的用户问题,在多个子图模式中,确定与用户问题最相匹配的子图模式,其中多个子图模式为对图模式分解得到,然后将用户问题与最相匹配的子图模式输入大语言模型,确定与用户问题对应的图查询语句,最后根据图查询语句搜索图数据库,确定目标图数据。本公开通过确定与用户问题最相匹配的子图模式,
将用户问题与最相匹配的子图模式输入大语言模型,约简了输入空间,高效生成了准确的图查询语句,提高了检索结果的准确性和答复信息的完整性。
[0041]根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
[0042]包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
[0043]图1示出根据本公开一实施例的图数据语义检索方法的流程图。
[0044]图2示出根据本公开一实施例的确定与用户问题最相匹配的子图模式的流程图。
[0045]图3示出根据本公开一示例性应用场景的图数据语义检索的流程图。
[0046]图4示出根据本公开一实施例的图数据语义检索装置的框图。
[0047]图5示出根据本公开实施例的一种电子设备的框图。
具体实施方式
[0048]以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
[0049]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图数据语义检索方法,其特征在于,所述方法包括:接收用户输入的用户问题,在多个子图模式中,确定与用户问题最相匹配的子图模式,所述多个子图模式为对图模式分解得到的;将所述用户问题与所述最相匹配的子图模式输入大语言模型,确定与所述用户问题对应的图查询语句;根据所述图查询语句搜索图数据库,确定目标图数据。2.根据权利要求1所述的方法,其特征在于,接收用户输入的用户问题前,所述方法还包括:根据业务的问答场景,将图模式分解为多个子图模式;其中,所述多个子图模式能够涵盖全部的业务问答场景。3.根据权利要求1所述的方法,其特征在于,所述在多个子图模式中,确定与用户问题最相匹配的子图模式,包括:将所述用户问题转换为问题向量;计算所述问题向量和多个描述向量的相似度,所述多个描述向量用于分别描述各子图模式能够解决的用户问题类型;根据相似度最大的描述向量,确定与用户问题最相匹配的子图模式。4.根据权利要求3所述的方法,其特征在于,在将所述用户问题转换为问题向量之前,所述方法还包括:将所述多个子图模式通过大语言模型进行自然语言重构,确定多个子图模式描述;将所述多个子图模式描述转换为多个描述向量。5.根据权利要求1所述的方法,其特征在于,确定目标图数据后,所述方法还包括:将所述目标图数据通过大语言模型进行自然语言重构,确定用户问题答案;将所述用户问题答案输出至用户前端。6.一种图数据语义检索装置,其特征在于,所述装置包括:匹配模块,用于接收用户输入的问题,在多个...

【专利技术属性】
技术研发人员:赵思同高雪峰仲光庆纪海杨成虎
申请(专利权)人:北京枫清科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1