向量数据检索方法、装置、设备及存储介质制造方法及图纸

技术编号:44365740 阅读:20 留言:0更新日期:2025-02-25 09:45
本发明专利技术属于计算机领域,公开了一种向量数据检索方法、装置、设备及存储介质。该方法包括:在接收到向量数据检索请求时,提取所述向量数据检索请求中的过滤条件;在所述过滤条件为不确定性过滤时,根据所述过滤条件预测所述向量数据检索请求对应的结果集在数据集中的稀疏程度;基于所述稀疏程度和所述过滤条件在所述数据集中进行向量数据检索。由于本发明专利技术是在过滤条件为不确定性过滤时,根据过滤条件预测向量数据检索请求对应的结果集在数据集中的稀疏程度;基于稀疏程度和过滤条件在数据集中进行向量数据检索。相对于现有的对整个数据集遍历进行检索的方式,本发明专利技术上述方式能够提高向量检索效率。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种向量数据检索方法、装置、设备及存储介质


技术介绍

1、在优化大模型对话质量过程中,需要实时获取跟问题更相关的样本数据作为大模型的提示词输入,相关技术中一般通过向量检索的方式从知识库中提取出能够用于大模型对话的辅助数据。向量检索用于在向量知识库中检索出与目标向量相似的样本数据,考虑到向量检索的性能问题,相关技术中的检索方式为先通过预先训练的分布预测模型,得到目标向量对应的预测分布,然后根据预测分布进行检索,上述相关技术虽然缩小了进行向量检索时的遍历范围,但是分布预测模型只能预测目标向量对应的预测分布,完成向量的检索还是需要对预测分布中的向量进行遍历检索,然后返回距离相近的topn个结果,再经由topn个结果进行过滤,上述向量检索方式,存在无法召回既定数据和检索效率不高的技术问题。

2、上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。


技术实现思路

1、本专利技术的主要目的在于提供了一种向量数据检索方法、装置、设备及存储介质,旨在解决现有本文档来自技高网...

【技术保护点】

1.一种向量数据检索方法,其特征在于,所述向量数据检索方法包括以下步骤:

2.如权利要求1所述的向量数据检索方法,其特征在于,所述基于所述稀疏程度和所述过滤条件在所述向量数据集中进行向量数据检索的步骤,包括:

3.如权利要求2所述的向量数据检索方法,其特征在于,所述基于所述向量索引召回数量和所述过滤条件在所述数据集中进行向量数据检索的步骤,包括:

4.如权利要求1所述的向量数据检索方法,其特征在于,所述基于所述稀疏程度和所述过滤条件在所述向量数据集中进行向量数据检索的步骤,包括:

5.如权利要求1-4任一项所述的向量数据检索方法,其特征在于...

【技术特征摘要】

1.一种向量数据检索方法,其特征在于,所述向量数据检索方法包括以下步骤:

2.如权利要求1所述的向量数据检索方法,其特征在于,所述基于所述稀疏程度和所述过滤条件在所述向量数据集中进行向量数据检索的步骤,包括:

3.如权利要求2所述的向量数据检索方法,其特征在于,所述基于所述向量索引召回数量和所述过滤条件在所述数据集中进行向量数据检索的步骤,包括:

4.如权利要求1所述的向量数据检索方法,其特征在于,所述基于所述稀疏程度和所述过滤条件在所述向量数据集中进行向量数据检索的步骤,包括:

5.如权利要求1-4任一项所述的向量数据检索方法,其特征在于,所述在接收到向量数据检索请求时,提取所述向量数据检索请求中的过滤条件的步骤之后,还包括:

6.如权利要求5所述的向量数据检索方法...

【专利技术属性】
技术研发人员:张向征林伟家刘子甲师奇
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1