一种图数据语义检索方法、装置、电子设备及存储介质制造方法及图纸

技术编号：38904118 阅读：8 留言：0更新日期：2023-09-22 14:22

本公开涉及一种图数据语义检索方法、装置、电子设备及存储介质。所述图数据语义检索方法包括：接收用户输入的用户问题，在多个子图模式中，确定与用户问题最相匹配的子图模式，其中多个子图模式为对图模式分解得到；将用户问题与最相匹配的子图模式输入大语言模型，确定与用户问题对应的图查询语句；根据图查询语句搜索图数据库，确定目标图数据。本公开实施例通过确定与用户问题最相匹配的子图模式，将用户问题与最相匹配的子图模式输入大语言模型，准确地过滤了无关信息，约简了输入空间，高效生成了准确的图查询语句，提高了检索结果的准确性和答复信息的完整性。索结果的准确性和答复信息的完整性。索结果的准确性和答复信息的完整性。

全部详细技术资料下载

【技术实现步骤摘要】
一种图数据语义检索方法、装置、电子设备及存储介质

[0001]本公开涉及图数据处理领域，尤其涉及一种图数据语义检索方法、装置、电子设备及存储介质。

技术介绍

[0002]随着大语言模型(large language model，LLM)的出现，已有部分业界人员借助LLM对图数据库中的图数据进行语义检索和问答，例如在输入自然语言的问题描述后使用LLM将其转换为数据库查询语言，从而进一步在图数据库中完成查询，输出查询的图数据。
[0003]由于LLM中没有图数据的模式信息，在相关技术中，通常是将图数据的模式信息和用户的问题同时输入给大语言模型。但是企业的图数据以及对应的图模式通常体量庞大，图数据存在节点数量多、节点属性信息多、关系数量多等性质，LLM无法接受如此庞大的上下文信息量，使得业界人员无法高效地利用LLM生成准确、完整的图查询语句，进而对图数据进行语义检索和问答。现有的解决LLM对输入文本长度限制的方法为将文本分割为短文本，然后基于关键词将短文本与用户问题进行匹配，最后将匹配成功的短文本与用户问题输入大语言模型，但该方法在根据图模式和用户问题生成图查询语句的场景下无法使用。
[0004]如何对基于LLM的图数据语义检索过程进行调整和优化，约简输入空间，高效生成准确的图查询语句，提高检索结果的准确性，是目前亟待解决的问题。

技术实现思路

[0005]有鉴于此，本公开提出了一种图数据语义检索方法、装置、电子设备及存储介质。
[0006]根据本公开的一方面，提供了一种图数据语义检...

【技术保护点】

【技术特征摘要】
1.一种图数据语义检索方法，其特征在于，所述方法包括：接收用户输入的用户问题，在多个子图模式中，确定与用户问题最相匹配的子图模式，所述多个子图模式为对图模式分解得到的；将所述用户问题与所述最相匹配的子图模式输入大语言模型，确定与所述用户问题对应的图查询语句；根据所述图查询语句搜索图数据库，确定目标图数据。2.根据权利要求1所述的方法，其特征在于，接收用户输入的用户问题前，所述方法还包括：根据业务的问答场景，将图模式分解为多个子图模式；其中，所述多个子图模式能够涵盖全部的业务问答场景。3.根据权利要求1所述的方法，其特征在于，所述在多个子图模式中，确定与用户问题最相匹配的子图模式，包括：将所述用户问题转换为问题向量；计算所述问题向量和多个描述向量的相似度，所述多个描述向量用于分别描述各子图模式能够解决的用户问题类型；根据相似度最大的描述向量，确定与用户问题最相匹配的子图模式。4.根据权利要求3所述的方法，其特征在于，在将所述用户问题转换为问题向量之前，所述方法还包括：将所述多个子图模式通过大语言模型进行自然语言重构，确定多个子图模式描述；将所述多个子图模式描述转换为多个描述向量。5.根据权利要求1所述的方法，其特征在于，确定目标图数据后，所述方法还包括：将所述目标图数据通过大语言模型进行自然语言重构，确定用户问题答案；将所述用户问题答案输出至用户前端。6.一种图数据语义检索装置，其特征在于，所述装置包括：匹配模块，用于接收用户输入的问题，在多个...

【专利技术属性】
技术研发人员：赵思同，高雪峰，仲光庆，纪海，杨成虎，
申请(专利权)人：北京枫清科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人