System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据检索方法、装置、设备及计算机可读介质制造方法及图纸_技高网

数据检索方法、装置、设备及计算机可读介质制造方法及图纸

技术编号:40275558 阅读:8 留言:0更新日期:2024-02-02 23:02
本申请涉及一种数据检索方法、装置、设备及计算机可读介质。该方法包括:获取提问数据;将所述提问数据转换为第一向量;在目标向量数据库中查询与所述第一向量匹配度最高的第二向量,其中,所述目标向量数据库是预先基于大语言模型建立的;返回与所述第二向量对应的回答数据作为所述提问数据的回答。本申请利用大语言模型建立目标向量数据库,利用向量数据库允许根据向量距离或相似性快速准确地搜索和检索数据,存储与其想要的领域或行业相关的不同主题、关键字、事实、观点、来源的信息,提高文本检索、语音/视频/图像检索、个性化推荐、智能搜索、智能问答等场景的准确度和速度,解决了大模型回答不准确、回答效率低的技术问题。

【技术实现步骤摘要】

本申请涉及互联网,尤其涉及一种数据检索方法、装置、设备及计算机可读介质


技术介绍

1、随着人工智能的不断发展,以大型语言模型(llms),如chatgpt和gpt4,由于其新兴能力和通用性,是全新一代知识表示和调用方式,相比以往知识图谱的方式,更加高效智能可扩展等,正在自然语言处理和人工智能领域掀起新浪潮,开启通用人工智能之门。然而,大语言模型面临的挑战是如何保障回答的问题准确可靠,回答不准确,很大程度上是大模型没有完全理解提问信息,以及没有找到与提问内容匹配度高的回答,因此,大模型回答不准确以及回答效率低是当下亟需解决的问题。

2、针对大模型回答不准确、回答效率低的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请提供了一种数据检索方法、装置、设备及计算机可读介质,以解决大模型回答不准确、回答效率低的技术问题。

2、根据本申请实施例的一个方面,本申请提供了一种数据检索方法,包括:获取提问数据;将所述提问数据转换为第一向量;在目标向量数据库中查询与所述第一向量匹配度最高的第二向量,其中,所述目标向量数据库是预先基于大语言模型建立的,所述目标向量数据库包括有所述第二向量和对应的回答数据之间的对应关系;返回与所述第二向量对应的回答数据作为所述提问数据的回答。

3、可选地,所述在目标向量数据库中查询与所述第一向量匹配度最高的第二向量之前,所述方法还包括按照如下方式基于大语言模型建立所述目标向量数据库:获取目标业务领域的文本数据,其中,所述目标业务领域为所述目标向量数据库面向的应用领域;将所述文本数据进行分词,得到词序列;将每一个所述词序列嵌入到预设长度的向量空间中,得到词向量序列;将所述词向量序列输入到串联的多个transformer块中的第一个transformer块,以通过串联的多个transformer块对所述词向量序列进行特征编码处理;获取最后一个transformer块输出的向量数据作为所述文本数据的语义特征保存到所述目标向量数据库中,并将所述向量数据和文本数据之间的对应关系保存在所述目标向量数据库中,以使提问数据在所述目标向量数据库中匹配到对应的向量数据时,将与所述向量数据对应的文本数据作为所述回答数据进行返回。

4、可选地,所述通过串联的多个transformer块对所述词向量序列进行特征编码处理的过程中,任一transformer块的处理包括:采用多头注意力机制计算输入向量的加权和向量,其中,所述输入向量为上一个transformer块的输出向量;将所述加权和向量输入前向网络,以通过所述前向网络提取表征所述文本数据的语义信息的内容特征向量;将所述内容特征向量与输入所述前向网络的所述加权和向量进行残差连接,得到残差连接向量;将所述残差连接向量输入归一化层进行归一化,得到归一化向量;获取所述文本数据的位置编码向量,并将所述归一化向量与所述位置编码向量相加,得到具有顺序信息的多维输出向量;将所述多维输出向量作为当前transformer块的输出向量,并作为下一个transformer块的输入向量。

5、可选地,所述采用多头注意力机制计算输入向量的加权和向量包括:分别将所述输入向量进行查询-键-值线性变换,得到查询向量、键向量以及值向量;将所述查询向量与所有键向量进行点积运算,得到注意力权重向量;将所述注意力权重向量与所有值向量进行加权求和,得到所述加权和向量。

6、可选地,所述通过所述前向网络提取表征所述文本数据的语义信息的内容特征向量包括:通过第一权重矩阵和第一偏置向量对所述加权和向量进行第一线性变换,以将所述加权和向量映射到目标特征空间,得到第一中间向量;将所述中间向量输入目标激活函数,以通过所述目标激活函数引入非线性特征,得到第二中间向量;通过第二权重矩阵和第二偏置向量对所述第二中间向量进行第二线性变换,以提取表征语义信息的向量并组合得到所述内容特征向量。

7、可选地,所述在目标向量数据库中查询与所述第一向量匹配度最高的第二向量包括:将所述第一向量和所述目标向量数据库中的第三向量分别进行归一化,得到第一归一化向量和第二归一化向量;计算所述第一归一化向量和所述第二归一化向量之间的夹角余弦值;将所述夹角余弦值作为所述第一向量和所述第三向量的相似度;将所述相似度最高的一个所述第三向量确定为与所述第一向量匹配度最高的所述第二向量。

8、可选地,所述在目标向量数据库中查询与所述第一向量匹配度最高的第二向量还包括:在所述第一向量为图像的向量时,随机从所述目标向量数据库中选择一个向量作为初级节点;从所述初级节点开始,逐级寻找每一级节点中与所述第一向量的相似度最高的前k个节点,以逐层构建多层图,其中,当前层级找到的前k个节点作为前一层级的邻居节点,所述邻居节点与前一层级找到的前k个节点连接,并作为下一层级的起始点继续寻找与所述第一向量的相似度最高的前k个节点;当搜索的节点层数达到层数阈值或搜索到的节点数达到点数阈值时,将当前得到的所述多层图作为与所述第一向量匹配度最高的第二向量。

9、根据本申请实施例的另一方面,本申请提供了一种数据检索装置,包括:获取模块,用于获取提问数据;转换模块,用于将所述提问数据转换为第一向量;查询模块,用于在目标向量数据库中查询与所述第一向量匹配度最高的第二向量,其中,所述目标向量数据库是预先基于大语言模型建立的;回答模块,用于返回与所述第二向量对应的回答数据作为所述提问数据的回答。

10、根据本申请实施例的另一方面,本申请提供了一种电子设备,包括存储器、处理器、通信接口及通信总线,存储器中存储有可在处理器上运行的计算机程序,存储器、处理器通过通信总线和通信接口进行通信,处理器执行计算机程序时实现上述方法的步骤。

11、根据本申请实施例的另一方面,本申请还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行上述的方法。

12、本申请实施例提供的上述技术方案与相关技术相比具有如下优点:

13、本申请提供了一种数据检索方法,包括:获取提问数据;将所述提问数据转换为第一向量;在目标向量数据库中查询与所述第一向量匹配度最高的第二向量,其中,所述目标向量数据库是预先基于大语言模型建立的,所述目标向量数据库包括有所述第二向量和对应的回答数据之间的对应关系;返回与所述第二向量对应的回答数据作为所述提问数据的回答。本申请利用大语言模型建立目标向量数据库,利用向量数据库允许根据向量距离或相似性快速准确地搜索和检索数据,存储与其想要的领域或行业相关的不同主题、关键字、事实、观点、来源的信息,提高文本检索、语音/视频/图像检索、个性化推荐、智能搜索、智能问答等场景的准确度和速度,解决了大模型回答不准确、回答效率低的技术问题。

本文档来自技高网...

【技术保护点】

1.一种数据检索方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述通过串联的多个transformer块对所述词向量序列进行特征编码处理的过程中,任一transformer块的处理包括:

3.根据权利要求2所述的方法,其特征在于,所述采用多头注意力机制计算输入向量的加权和向量包括:

4.根据权利要求2所述的方法,其特征在于,所述通过所述前向网络提取表征所述文本数据的语义信息的内容特征向量包括:

5.根据权利要求1至4任一所述的方法,其特征在于,所述在目标向量数据库中查询与所述第一向量匹配度最高的第二向量包括:

6.根据权利要求1至4任一所述的方法,其特征在于,所述在目标向量数据库中查询与所述第一向量匹配度最高的第二向量还包括:

7.一种数据检索装置,其特征在于,包括:

8.一种电子设备,包括存储器、处理器、通信接口及通信总线,所述存储器中存储有可在所述处理器上运行的计算机程序,所述存储器、所述处理器通过所述通信总线和所述通信接口进行通信,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至6任一项所述的方法的步骤。

9.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求1至6任一所述方法。

...

【技术特征摘要】

1.一种数据检索方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述通过串联的多个transformer块对所述词向量序列进行特征编码处理的过程中,任一transformer块的处理包括:

3.根据权利要求2所述的方法,其特征在于,所述采用多头注意力机制计算输入向量的加权和向量包括:

4.根据权利要求2所述的方法,其特征在于,所述通过所述前向网络提取表征所述文本数据的语义信息的内容特征向量包括:

5.根据权利要求1至4任一所述的方法,其特征在于,所述在目标向量数据库中查询与所述第一向量匹配度最高的第二向量包括:

【专利技术属性】
技术研发人员:赵鹏辉李绍斌唐杰黄鑫史欣宇
申请(专利权)人:珠海格力电器股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1